rubus0304 님의 블로그

[ADsP 3주차] 강의요약 본문

자격증/ADsP

[ADsP 3주차] 강의요약

rubus0304 2024. 10. 10. 22:25

 

 

적절한 활용방안과 유즈케이스의 탐색:

기존 잘 구현된 시나리오 있으면 만들지말고 그냥 써라

 

 

 

 

 

폭포수 모델의 단점은 가장 마지막에 고객에게 보여줄 수 있음 피드백 느림

프로토타입은 이를 보완하여 바로 개선 바로 개선 가능.

 

 

CRISP_DM 분석방법론은 KDD분석 방법론 (단방향) 과 달리 단방향으로 구성되어 있지 않고 단계 간 피드백 통해 단계별 완성도 높인다는 차이점 있음

 

1. 이해단계 추가 (업무 이해, 데이터 이해)

2. 단계간 피드백 (데이터 준비 - 모델링 간)

 

 

 

빅데이터 분석 방법론 5단계에서 시스템 구현 단계는 반드시 한다 NO! 필요 시 한다 YES!

 

 

하둡 : 대용량 정보 분산처리 시스템 

 

 

탐색적 데이터 분석 (EDA): 내가 지금 갖고 있는 데이터의 특징을 파악하는 것  평균, 분산, 최대최소값

 

** 테스크: 모델링 - 데이터 분할 - 모델의 과적합을 막고 일반화를 위해서 훈련용 데이터와 테스트용 데이터로 분할해야한다. (ex. 100개 예상문제에서만 나오는 시험은 좋은 시험이 아님 전체 범위에서 나오는 시험용 테스트 따로 만들어야 좋은 데이터 분석)

 

 

테스크: '모델 평가 및 검증'  ( 그 다음 마지막 페이지 '평가 및 전개'  X) 

 

 

 

 

 

 

 

 

 

문제가 주어져 있는 상태에서 답을 구하는게 하향식 (전통적)

그러나, 빠르게 변하는 기업환경에선 문제 자체의 변화가 심하므로 정확히 문제를 사전에 정의하는 게 어려워짐  - 이런 경우 문제를 제대로 모른다면 상향식 접근법을 사용.

실제에선 하양식, 상향식 혼용 / 상호보완 관계로 할 때 최적이다.

 

 

규제와 감사/ 지원 인프라

 

 

다회독 때 내용들도 더 채워나가는 것 지금은 쭉쭉 읽고 넘어가기

 

 

공부하다 길을 잃을 수 있으니 크게 잡고 여기에서 이 파트에서 공부하고 있구나 확인하기

 

 

 

상향식 접근법: 데이터에서 문제를 찾는 것 (먼저 분석을 시작하고 그 결과로부터 가치있는 결과 찾는 것)

 

디자인 사고:  공갑 - 문제를 정의 -> 아이디어를 자유롭게 내기 (실현가능서 상관없이) -> 이 아이디어 바탕으로 프로토타입 시나리오 만들고 TEST 단계로 검증하는 넘기는 것. 

 

 

1. 총탄이 가운데 (정확도)

2. 총탄이 퍼짐 (정밀도)

총탄이 가운데 (정확도) / 총탄이 퍼집 (정밀도)

 

TIME BOXING 기법이란 : 현재 할당된 작업이 주어진 시간 내 완수하지 못했더라도 다음 작업으로 넘어가는 방법

 --> 분석과제 관리 중에서 '시간'

 

나머지 보기들은 어디서 나온걸까/
문제가 없음

 

'자격증 > ADsP' 카테고리의 다른 글

[ADsP 6주차] 강의요약  (0) 2024.10.14
[ADsP 5주차] 강의요약  (0) 2024.10.14
[ADsP 4주차] 강의요약 (2과목 끝 - 3과목 시작)  (1) 2024.10.11
[ADsP 2주차] 강의요약  (1) 2024.10.10
[ADsP 1주차] 강의요약  (0) 2024.10.10