rubus0304 님의 블로그
[머신러닝 빌드업2] 지도, 비지도, 강화학습 본문
1) 지도학습
- 문제와 정답을 모두 알려주고 학습시키는 방법
- 독립 변수(특성, Feature, X data)와 종속 변수(타겟, Label, Y data)의 세트로 구성된 데이터셋을 이용해 모델을 학습합니다.
- Feature가 주어졌을 때 적절한 답변을 모델이 내놓는 것이 목적입니다.
- 타겟의 성격에 따라 크게 두 가지 문제로 분류 가능합니다.
- 예측 (Prediction)
- 평점, 시간, 가격, 변동률 등 타겟이 연속형(Continuous)인 경우
- 예시 1) 머니볼
-
- 2000년대 초반에 낮은 예산으로 운영되던 오클랜드 애슬레틱스의 단장 빌리 빈은 데이터를 기반으로 선수 가치를 평가하는 ‘세이버 매트릭스’라는 분야를 창시
- 선수 가치를 평가하여 선수 연봉 대비 승리에 미치는 영향을 예측하는 모델을 생성
- 승리에 영향을 변수를 탐색하고 OPS(출루율+장타율), WHIP(이닝당 안타와 볼넷 허용률) 등의 지표를 생성하여 분석에 활용
- 저예산으로도 효율이 좋은 선수를 구매 및 트레이드하여 2002년에 20연승을 하고 플레이오프에 진출하는 등의 저력을 발휘
- 분류 (Classification)
- 예측 (Prediction)
2) 비지도 학습 (Unsupervised Learning)
- 답을 가르쳐주지 않고 공부시키는 방법입니다.
- 모델을 학습할 때 별도의 타겟 변수를 설정하지 않습니다.
- 주어진 데이터에서 모델이 스스로 데이터의 특성을 파악하고 모델을 만듭니다.
- 연관 규칙 (Association Rule)
- 장바구니 분석이라고도 하며, 데이터셋 내에서 항목 간의 연관된 규칙을 찾는 방법
- 예시) 타겟(Target)의 임신 예측 모델
- 장바구니 분석이라고도 하며, 데이터셋 내에서 항목 간의 연관된 규칙을 찾는 방법
3) 강화 학습 (Reinforcement Learning)
출처 - https://github.com/sdlee94/Minesweeper-AI-Reinforcement-Learning
- 보상을 통해 상은 최대화, 벌은 최소화하는 방향으로 행위를 강화하는 학습입니다.
- 에이전트가 시행착오를 통해 학습하는 방식으로 실제 사람이나 동물이 학습하는 방식과 유사합니다.
- 예시
- 알파고와 같은 게임 AI
'Data Analyst > 라이브세션' 카테고리의 다른 글
[비즈니스 매트릭스 기초] (0) | 2024.12.11 |
---|---|
[머신러닝 군집] (0) | 2024.11.28 |
[머신러닝 빌드업 1] 머신러닝 개념 (0) | 2024.11.21 |
[통계야 놀자] 강의 주요내용 (1) | 2024.11.21 |
[통계야 놀자] 회귀와 예측 - 실습 (0) | 2024.11.20 |