목록2024/11 (45)
rubus0304 님의 블로그
[통계학] 통계야 놀자 - 5회차 그렇다면 만약 게임시간이 1000시간이면, 전기세는 얼마일까요? 우리가 가진 데이터셋에 해당 값이 없을 때, 이를 예측하기 위해 ‘회귀분석’의 개념이 도입됩니다. 이러한 예측을 위해 위 그래프에서 붉은색으로 보이는 ‘추세선’ 이 필요한데요!회귀분석의 목적은 이 ‘추세선’을 찾는 것이 목적이 됩니다. 추세선 = “우리가 이미 가지고 있는 데이터들을 가장 잘 설명해주는 선” 을 의미합니다. 추세선은 y = a+bx (방정식)으로 표현됩니다. x: 게임시간(독립변수) y: 전기세(종속변수) a: 절편(x 가 0일때 y값) b: 기울기 이렇게 추세선을 파악함으로써, 게임시간이 1000시간과 추세선이 만나는 점을 통해 종속변수를예측할 수 있게 되는 것입니다. 이러한 특징을 ..
보호되어 있는 글입니다.
보호되어 있는 글입니다.
https://teamsparta.notion.site/1-328d08b2df7e47fba43416f7f8238bbc 1. 머신러닝의 기초 | Notion목차teamsparta.notion.site 머신러닝 정의: 관측된 패턴을 기반으로 의사 결정을 하기 위한 알고리즘 AI: 인간의 지능을 요구하는 업무를 수행하기 위한 시스템Machine Learning: 관측된 패턴을 기반으로 의사 결정을 하기 위한 알고리즘Deep Learning: 인공신경망을 이용한 머신러닝Data science: AI를 포괄하여 통계학과 컴퓨터공학을 바탕으로 발전한 융합학문Data Analysis: 데이터 집계, 통계 분석, 머신러닝을 포함한 행위📌 머신러닝(Machine Learning, ML)은기술 통계 등을 통하여 집계..
[통계학] 통계야 놀자 - 3회차 [통계학] 통계야 놀자 - 3회차 | Notion[강의자료 PDF]teamsparta.notion.site ROI 투자대비 수익 A/B 테스트를A/B Dashboard - 그로스 마케터파이썬 - 데이터븐석가 신뢰수준 대신 유의수준을 지정. (파이썬이 먼저 지정) 유의수준 - 중심극한정리 복습 검정통계량 T 검정 - 모집단 크기/ 분산 알 수 알 수 있으면 Z검정/ 분산 알 수 없으면 T 검정 🚩 p-value: 어떠 사건이 우연히 발생할 확률 (Probability Value : 확률) 통계적으로 아무리 정답이어도, 데이터분석가는 의미가 있지만 데이터를 뜯어봐야함.가설을 세우고 실제로 데이터가 어떻게 생겼는지 봐야함. 실습 # 라이브러리 호출 import ..
1. 스파르타(주)의 글로벌 확장을 준비 중인 팀은 신규 시장에 진출하기 위한 전략을 수립하고 있습니다. 국가 타게팅를 통해 잠재적 고객층을 확대하고자 합니다. 이에 따라, 대상이 되는 국가의 수를 먼저 정확히 파악하기 위해 데이터를 활용해 보고서를 작성하고 있습니다.country 테이블을 기반으로, 전년도 국민총생산(GNP)이 없거나 전년 대비 GNP가 감소한 국가 중 인구가 1천만 명 이상인 국가의 수를 조회하는 쿼리를 작성하세요. (내 코드)#country 테이블을 기반으로, 전년도 국민총생산(GNP)이 없거나 전년 대비 GNP가 감소한 국가 중 인구가 1천만 명 이상인 국가의 수를 조회하는 쿼리 use world ; # world 테이블을 사용할 거니까!select count(Code) c..
https://yozm.wishket.com/magazine/detail/1656/ A/B 테스트 제대로 이해하기: ③ A/B 테스트 계산기의 세팅과 해석 | 요즘IT앞선 두 편의 글에서, ‘실제 A/B 테스트를 설계할 때 우리가 진짜 궁금한 질문’과 ‘A/B 테스트 실험 결과의 유의미한 방안’, 그리고 ‘이를 바탕으로 A/B 테스트의 설계 및 해석에 필요한 기초yozm.wishket.com 요약 : 과학연구가 아닌 ‘비즈니스’ 실험이라는 가설 아래 A/B테스트의 설계, 수행, 해석계산-구글 옵티마이저 같은 A/B테스트 툴에서 전환율 및 표본 크기에 따른 유의미한 결과를 계산해 최종 판단에 도움 준다.AB Testquide- A/B 테스트 결과를 제공하는 계산기, 간단한 숫자만 입력해도 유의미한 결과를 ..
[통계학] 통계야 놀자 - 2회차 내용: 가설설정, 통계적 유의성, 가설검정 - 이론 99% 신뢰구간이 더 넓어져서 모수를 추측하기 어려워서 좋다 나쁘다 고를 수 없음. 95% 신뢰구간이 더 신뢰가 높음! 이번 강의에서 배울 것 변수: 대상의 속성이나 특성을 측정하여 기록한 것독립변수: 원인이 되는 변수로, 설명변수라고도 불립니다.종속변수: 결과가 되는 변수로, 결과변수라고도 불립니다. 독립변수에 따라 그 값이 변할 것이라고 예상하는 변수입니다.모수: 모집단을 대표하는 값모수통계: 모집단이 정규분포를 따른다는 가정하에 사용됩니다. 데이터분석가는 주로 모수통계를 진행하게 됩니다. ****평균, 분산 등의 값을 알고 있다는 가정 하에 진행하는 통계분석이 되겠습니다.비모수통계: 모집단이 정규분포가 아닐 때 사..
101. Product Sales Analysis IIIhttps://leetcode.com/problems/product-sales-analysis-iii/description/ Write a solution to select the product id, year, quantity, and price for the first year of every product sold.Return the resulting table in any order. (오답) 첫 해에 판매해서 min 썼고, left join 했는데 왜 안 될까.select b.product_id, min(year) first_year, quantity, pricefrom Sales a lef..