rubus0304 님의 블로그

[머신러닝 빌드업2] 지도, 비지도, 강화학습 본문

Data Analyst/라이브세션

[머신러닝 빌드업2] 지도, 비지도, 강화학습

rubus0304 2024. 11. 25. 16:09

[Python] 머신러닝 빌드업 - 2회차

 

[Python] 머신러닝 빌드업 - 2회차 | Notion

[강의자료 PDF]

teamsparta.notion.site

 

 

 

 

1) 지도학습

  • 문제와 정답을 모두 알려주고 학습시키는 방법
    • 독립 변수(특성, Feature, X data)와 종속 변수(타겟, Label, Y data)의 세트로 구성된 데이터셋을 이용해 모델을 학습합니다.
    • Feature가 주어졌을 때 적절한 답변을 모델이 내놓는 것이 목적입니다.
  • 타겟의 성격에 따라 크게 두 가지 문제로 분류 가능합니다.
    1. 예측 (Prediction)
      • 평점, 시간, 가격, 변동률 등 타겟이 연속형(Continuous)인 경우
      • 예시 1) 머니볼
        • 2000년대 초반에 낮은 예산으로 운영되던 오클랜드 애슬레틱스의 단장 빌리 빈은 데이터를 기반으로 선수 가치를 평가하는 ‘세이버 매트릭스’라는 분야를 창시
        • 선수 가치를 평가하여 선수 연봉 대비 승리에 미치는 영향을 예측하는 모델을 생성
        • 승리에 영향을 변수를 탐색하고 OPS(출루율+장타율), WHIP(이닝당 안타와 볼넷 허용률) 등의 지표를 생성하여 분석에 활용
        • 저예산으로도 효율이 좋은 선수를 구매 및 트레이드하여 2002년에 20연승을 하고 플레이오프에 진출하는 등의 저력을 발휘
    2. 분류 (Classification)

 

2) 비지도 학습 (Unsupervised Learning)

  • 답을 가르쳐주지 않고 공부시키는 방법입니다.
    • 모델을 학습할 때 별도의 타겟 변수를 설정하지 않습니다.
  • 주어진 데이터에서 모델이 스스로 데이터의 특성을 파악하고 모델을 만듭니다.
  1. 연관 규칙 (Association Rule)
    • 장바구니 분석이라고도 하며, 데이터셋 내에서 항목 간의 연관된 규칙을 찾는 방법
      • 예시) 타겟(Target)의 임신 예측 모델

3) 강화 학습 (Reinforcement Learning)

출처 - https://github.com/sdlee94/Minesweeper-AI-Reinforcement-Learning

  • 보상을 통해 상은 최대화, 벌은 최소화하는 방향으로 행위를 강화하는 학습입니다.
  • 에이전트가 시행착오를 통해 학습하는 방식으로 실제 사람이나 동물이 학습하는 방식과 유사합니다.
  • 예시
    • 알파고와 같은 게임 AI