자격증/ADsP
[ADsP 6주차] 강의요약
rubus0304
2024. 10. 14. 17:18
데이터 마트와 데이터 웨어하우스 구분
데이터 마트 개발 - 패키지들 안 봐도 된다 (시험에는 안 나옴)) 이론 위주로
SQLDF = SQL 을 R에서 사용 가능하게 해주는 패키지
단순 확률 대치법: 전체 평균이 아닌 그 근처에 값 평균값 (KNN - K 군집)
다중 대치법: 값에 다양한 값 대치해서 데이터 셋 여러개 만들어보는 것
이상값: 보통은 제외하고 분석 (결과도출에 방해하는 값으로 인식// but, 무조건 제외 노노.
Q1 1사분, Q2 2사분 (중앙값), Q3 3사분