rubus0304 님의 블로그

[ADsP 6주차] 강의요약 본문

자격증/ADsP

[ADsP 6주차] 강의요약

rubus0304 2024. 10. 14. 17:18

데이터 마트와 데이터 웨어하우스 구분

다른 사람들이 미리 만들어놓은 패키지 그 패키지 활용 가능

 

 

 

데이터 마트 개발  -  패키지들 안 봐도 된다  (시험에는 안 나옴)) 이론 위주로 

 

 

 

 

SQLDF =  SQL 을 R에서 사용 가능하게 해주는 패키지  

 

많이 쓰는 패키지이긴 하지만 지금은 굳이 안 봐도

 

 

 

 

 

 

 

파란칸은밑에서 설명

 

 

 

 

 

나머지 평균 내서 결측치 넣자 -> 평균 대치법

 

단순 확률 대치법:  전체 평균이 아닌 그 근처에 값 평균값  (KNN - K 군집)

  

다중 대치법: 값에 다양한 값 대치해서 데이터 셋 여러개 만들어보는 것

 

 

 

이상값:  보통은 제외하고 분석 (결과도출에 방해하는 값으로 인식// but, 무조건 제외 노노. 

 

ESD : 평균적으로 3표준편차만큼 떨어진 값을 이상값으로 인식

 

Q1 1사분, Q2 2사분 (중앙값), Q3 3사분

Q2 (중앙값 기준)을 보고 위로 50% 아래로 50% 있다는 걸 알 수 있음.

 

IQR

 

최솟값, 최댓값을 벗어난 수 = 이상값

 

boxplot

 

우리 사분위수 -2,0,1,2 인데,, 19, 28, 36 은 너무 떨어져 있음 이상치 날리고 일하자

 

 

 

 

'자격증 > ADsP' 카테고리의 다른 글

[ADsP 8주차] 강의요약  (0) 2024.10.15
[ADsP 7주차] 강의요약  (1) 2024.10.14
[ADsP 5주차] 강의요약  (0) 2024.10.14
[ADsP 4주차] 강의요약 (2과목 끝 - 3과목 시작)  (1) 2024.10.11
[ADsP 3주차] 강의요약  (3) 2024.10.10