rubus0304 님의 블로그
프로젝트 시작! 본문
프로젝트 달달
날짜 | 계획 |
11/29(금) | -2PM 주제 정하기 -9PM 계획서 제출 |
12/2(월) | -데이터전처리(이상치,결측치) 완성 -머신러닝 |
12/3(화) | -시각화 완성 |
12/4(수) | -PPT들어갈 내용정리 |
12/5(목) | -PPT완성 |
12/6(금) | -발표스크립트 준비 -발표영상녹화 및 투표 -9PM PPT, 발표영상 제출 |
12/9(월) | -발표(10분) |
[제출물]
PPT
Python 코드 정리 파일
대표 썸네일: 1280픽셀 * 720픽셀 (16:9 종횡비)
** 이번 발표 유의사항
ETA (Estimated Time of Arrival’ 도착예정시간 마감기한 맞추기 주제!
ONAIR 순서발표
추가 평가항목: 기획안과 최종 결과물의 일치여부
1.분석목표 일치/ (설정분석목표와 결과물 잘 맞는지 평가)
2.분석방법 적용/ (제시된 분석방법이 실제결과에 반영되었는지 평가)
3.변경 사항의 적절성 (기획안과 다른 부분 있을 경우, 변경이 합리적이고 목적에 맞는지 평가)
[11/29]
11:00~12:00 각 주제 데이터 파악
12:00~13:00 주제관련 의견논의 및 주제 제출
14:00 주제 선정 구글폼 마감
14:00~18:00 기획안 의논 및 작성완료
20:00 기획안 제출
21:00 기획안 마감 (변경 불가)
1. 주제 정하기
회귀:
-부동산 데이터 - 집값 예측
-교통 데이터 - 교통사고 피해 예측
분류: 음원, 고객
-스타벅스 리워드 - 고객분류
-음악 데이터 - 음악장르 분류
군집: 이커머스, 금융
-마케팅 데이터 - 고객 클러스터링
-금융 데이터 - 고객 클러스터링
이수현:
1순위: 교통사고 피해 예측(우리나라 데이터고 ai 경진대회 프로젝트 데이터라서 참고할 내용도 많고 이해하기 쉬울 것이라고 생각)
2순위: 음악(장르 분류라서 상대적으로 간단해 보임, 해커톤 자료를 변형한 거라서 데이터가 형식을 잘 갖추고 있는 편)
3순위: 금융 데이터(군집…이지만… 데이터 분석을 가장 많이 쓰는 도메인의 데이터라서 지금 해 두면 나중에 도움이 많이 될 것 같고 해야 하는 일과 결과물이 명확해서 좋음)
김동현:
1순위 교통 데이터(도메인 익숙/외부자료 거의 필요없음/gis 등을 이용해서 시각화 잘 표현 가능)
2순위 금융 클러스터링(튜터님 도움 많이 받을 수 있을듯?/군집분석 경험 필요하다고 생각함)
3순위 스타벅스 리워드(도메인 익숙/외부자료 조사 필요없음)
송동민:
1순위-음악: 다양한 주제로 삼기에 적합한 데이터 타입들, 노래 자체도 도메인적으로 찾기 쉬울것 같습니다.
(순위 차트는 아마 2017년 데이터가 아닐까.. 상위노래들이 2017년 곡들이네요)
2순위-교통 데이터: 진행방법 예시가 좋아서 안전하게 프로젝트를 완료하는 지침이 되어 줄것 같은 형식식
3순위-캘리포니아 부동산 -> 포기 사유: 1990년대 데이터라 흥미가 확 식었습니다.
김은혜
1순위: 분류_스타벅스 (도메인 익숙/ profile 17000개, transcript 30만개 적당)
2순위: 회귀_부동산 (약 2만개 샘플/ 튜터님 서정욱 튜터님 예상)
3순위: 회귀_음악 (2개 이상 머신러닝 비교/ artist, song 각 8000개 데이터)
(나머지 4,5,6 순위 - 군집의 경우 100만개 데이터 파일(finance),교통 AI (필수과제 많음)
회귀_교통/ 회귀_부동산 / 분류_음악 /
이수현: 교통
김동현:교통
송동민: 교통
김은혜: 교통
'Data Analyst > daily' 카테고리의 다른 글
[프로젝트 3일차] (0) | 2024.12.03 |
---|---|
[프로젝트 2일차] (0) | 2024.12.02 |
[코트카타 102] (0) | 2024.11.27 |
[QCC 3회차] (0) | 2024.11.22 |
[QCC 2회차] (0) | 2024.11.15 |