목록2024/11 (45)
rubus0304 님의 블로그
[Python] 머신러닝 빌드업 - 2회차 [Python] 머신러닝 빌드업 - 2회차 | Notion[강의자료 PDF]teamsparta.notion.site 1) 지도학습문제와 정답을 모두 알려주고 학습시키는 방법독립 변수(특성, Feature, X data)와 종속 변수(타겟, Label, Y data)의 세트로 구성된 데이터셋을 이용해 모델을 학습합니다.Feature가 주어졌을 때 적절한 답변을 모델이 내놓는 것이 목적입니다.타겟의 성격에 따라 크게 두 가지 문제로 분류 가능합니다.예측 (Prediction)평점, 시간, 가격, 변동률 등 타겟이 연속형(Continuous)인 경우예시 1) 머니볼2000년대 초반에 낮은 예산으로 운영되던 오클랜드 애슬레틱스의 단장 빌리 빈은 데이터를 기반으로 ..
[Python] 챌린지 - 5회차 [Python] 챌린지 - 5회차 | Notion[강의자료 PDF]teamsparta.notion.site 위에 식만 돌아감 ETL 은 데이터 양 줄여서 중요한 정보만 넣는게 트랜드 였음 Give yourselves a pat on the back 등을 두드려주세요
[4기] QCC - 3회차 [4기] QCC - 3회차 | Notion셋팅 안내teamsparta.notion.site[ 문제 ]당신은 이커머스 회사 ’루팡(주)’의 고객 코호트 분석팀에 속해 있습니다. 이번 분석의 목표는 2011년 12월에 첫 주문을 한 고객에 대해, 여러 연도별 매출 관련 지표를 집계하는 것입니다. 1. 첫 주문 날짜가 2011년 12월인 고객만 필터링2. 각 고객의 첫 주문과 마지막 주문 사이의 기간을 기준으로, 그 기간 동안의 연평균 총거래액(GMV)을 계산합니다. 소수점 2째자리까지 계산해주세요.3. 고객별 각 연도에서의 주문 수를 집계하고, 최대값과 그 최대값을 발생시킨 연도를 찾습니다.4. 결과는 고객 ID(customerid) 기준으로 오름차순으로 정렬합니다. 총거래액, ..
[Python] 머신러닝 빌드업 - 1회차 1) 머신 러닝에 대한 정의 머신 러닝은 데이터를 활용하여 작업의 성능을 향상하기 위해 모델(머신)을 학습해나가는 과정 딥 러닝 → 머신 러닝 → AI 순으로 그 개념의 범위가 넓어집니다.AI: 마치 인간처럼 학습 및 추론을 할 수 있도록 만들어진 프로그램머신 러닝: 데이터를 활용해 명시적으로 프로그래밍되지 않고도 학습할 수 있는 알고리즘딥 러닝: 머신 러닝의 종류 중 하나로 인공 신경망을 이용해 거대한 데이터셋을 학습하는 방법 2) 빅데이터와 머신 러닝빅데이터란?말 그대로 과거와는 비교가 안되는 엄청난 규모의 데이터를 칭하는 용어3) 통계학과 머신 러닝통계학: 표본에서 모집단의 특성을 추론하는 것이 중점입니다.내가 수집한 데이터가 모집단을 얼마나 잘 반영하..
통계와 머신러닝 01. 통계와 머신러닝의 관계성 두가지의 방법론은 상호보완적이라고 이해해주시면 좋겠습니다. 🙂통계적 가설검정이 머신러닝을 보완하는 경우머신러닝 모델의 피처 선택(컬럼 선택)에서 유의미한 변수를 찾기 위해 통계적 가설검정 사용데이터 분포, 이상치 처리 등 데이터 전처리에 유용한 통계적 기법을 제공머신러닝이 가설검정을 보완하는 경우비선형 데이터의 관계를 처리링하거나 대규모 데이터에서 가설 검정의 한계를 보완예를 들어, 통계적 가설검정은 변수 간 독립성을 가정하고 진행되지만, 머신러닝은 이러한 제약 없이 상관 및 연관성을 탐지합니다.두가지 방법론의 융합(심화 프로젝트에서 해야 하는 부분)통계적 가설검정을 사용해 데이터 탐색 및 초기 분석을 수행한 후, 머신러닝을 통해 예측 성능을 극대..
https://teamsparta.notion.site/08d443adff404876b5dde2dc9ca57c63 머신러닝의 이해와 라이브러리 활용 기초 | Notion실습 정답 자료teamsparta.notion.site https://teamsparta.notion.site/3-fe9d135d7f3441ab97bd71a4c224391c 3. 분류분석 - 로지스틱회귀 | Notion1. 학습목표teamsparta.notion.site https://www.kaggle.com/c/titanic/data Titanic | NoviceKaggle profile for Titanicwww.kaggle.com pandas.pydata.org pd.pivot_table(titaninc_df, index =..
보호되어 있는 글입니다.
보호되어 있는 글입니다.
보호되어 있는 글입니다.
https://yozm.wishket.com/magazine/detail/1931/ 확실히 알아두면 만사가 편해지는 머신러닝 10가지 알고리즘 | 요즘IT실무에서 원활히 머신러닝으로 데이터를 분석하는 데 얼마나 많은 알고리즘을 알고 있어야 할까요? 선형, 군집, 트리 같은 기본 개념을 알고 XGBoost와 LightGBM 같은 최신 알고리즘을 알면 우선 현yozm.wishket.com 요약 : 머신러닝 TOP 101.선형회귀분석 (지도학습, 선형관계전제 / 예측력부족)2.로지스틱회귀분석 (지도학습, 선형관계전제, 회귀/분류/ 예측력부족)3.K-최근접 이웃(KNN) (지도학습, 이웃 데이터 고려 예측/ 대용량 취약)4.나이브 베이즈(지도학습, 조건부 확률로 데이터 분류/ 독립변수 모두 독립적 전제)5.결..