rubus0304 님의 블로그
[ADsP 3주차] 강의요약 본문
적절한 활용방안과 유즈케이스의 탐색:
기존 잘 구현된 시나리오 있으면 만들지말고 그냥 써라
폭포수 모델의 단점은 가장 마지막에 고객에게 보여줄 수 있음 피드백 느림
프로토타입은 이를 보완하여 바로 개선 바로 개선 가능.
CRISP_DM 분석방법론은 KDD분석 방법론 (단방향) 과 달리 단방향으로 구성되어 있지 않고 단계 간 피드백 통해 단계별 완성도 높인다는 차이점 있음
1. 이해단계 추가 (업무 이해, 데이터 이해)
2. 단계간 피드백 (데이터 준비 - 모델링 간)
빅데이터 분석 방법론 5단계에서 시스템 구현 단계는 반드시 한다 NO! 필요 시 한다 YES!
하둡 : 대용량 정보 분산처리 시스템
탐색적 데이터 분석 (EDA): 내가 지금 갖고 있는 데이터의 특징을 파악하는 것 평균, 분산, 최대최소값
** 테스크: 모델링 - 데이터 분할 - 모델의 과적합을 막고 일반화를 위해서 훈련용 데이터와 테스트용 데이터로 분할해야한다. (ex. 100개 예상문제에서만 나오는 시험은 좋은 시험이 아님 전체 범위에서 나오는 시험용 테스트 따로 만들어야 좋은 데이터 분석)
테스크: '모델 평가 및 검증' ( 그 다음 마지막 페이지 '평가 및 전개' X)
문제가 주어져 있는 상태에서 답을 구하는게 하향식 (전통적)
그러나, 빠르게 변하는 기업환경에선 문제 자체의 변화가 심하므로 정확히 문제를 사전에 정의하는 게 어려워짐 - 이런 경우 문제를 제대로 모른다면 상향식 접근법을 사용.
실제에선 하양식, 상향식 혼용 / 상호보완 관계로 할 때 최적이다.
상향식 접근법: 데이터에서 문제를 찾는 것 (먼저 분석을 시작하고 그 결과로부터 가치있는 결과 찾는 것)
디자인 사고: 공갑 - 문제를 정의 -> 아이디어를 자유롭게 내기 (실현가능서 상관없이) -> 이 아이디어 바탕으로 프로토타입 시나리오 만들고 TEST 단계로 검증하는 넘기는 것.
1. 총탄이 가운데 (정확도)
2. 총탄이 퍼짐 (정밀도)
TIME BOXING 기법이란 : 현재 할당된 작업이 주어진 시간 내 완수하지 못했더라도 다음 작업으로 넘어가는 방법
--> 분석과제 관리 중에서 '시간'
'자격증 > ADsP' 카테고리의 다른 글
[ADsP 6주차] 강의요약 (0) | 2024.10.14 |
---|---|
[ADsP 5주차] 강의요약 (0) | 2024.10.14 |
[ADsP 4주차] 강의요약 (2과목 끝 - 3과목 시작) (1) | 2024.10.11 |
[ADsP 2주차] 강의요약 (1) | 2024.10.10 |
[ADsP 1주차] 강의요약 (0) | 2024.10.10 |