목록분류 전체보기 (146)
rubus0304 님의 블로그
[4기] 통계 + 머신러닝 개인 과제 [4기] 통계 + 머신러닝 개인 과제 | Notion제출 마감 : 2024. 12. 11 (수) 15:00 까지teamsparta.notion.site 필수 1. 기초통계statistics csv 파일을 읽고, 성별 Review Rating 에 대한 평균과 중앙값을 구해주세요. 결과는 소수점 둘째자리까지 표현해주세요.그리고 이에 대한 해석을 간략하게 설명해주세요.import pandas as pd import numpy as np import scipy.stats as statsfrom datetime import datetime, timedelta import warningswarnings.filterwarnings('ignore')df=pd.read_csv("s..
https://teamsparta.notion.site/3-796ebd60ffab48cfa954efa9a2fcea0e 3. 데이터 시각화 | Notion모든 토글을 열고 닫는 단축키 Windows : Ctrl + alt + t Mac : ⌘ + ⌥ + tteamsparta.notion.site https://prod-apnortheast-a.online.tableau.com/t/teamsparta/authoring/airbnb_17338191673250/1/%EC%8B%9C%ED%8A%B8%208#1 TableauUnexpected Error An unexpected error occurred. If you continue to receive this error please contact your Ta..
[메트릭] 비즈니스 메트릭 기초 [메트릭] 비즈니스 메트릭 기초 | Notion[강의 자료 PDF]teamsparta.notion.site 1. AARRR Acquisition (유입) : 제품을 처음 발견하고 접근하는 경로를 이해하는 데 중점 Metric:신규 사용자수: 특정 기간 동안 유입된 신규 사용자의 총 수회원가입 전환율 (Sign-up Conversion Rate): 앱 방문자가 실제로 회원가입을 완료하는 비율고객 획득 비용 (CAC, Customer Acquisition Cost): 신규 고객 한 명을 유치하기 위해 지출한 평균 비용Acquisition 전략:유입 채널 최적화 (네이버, 구글 등)회원가입 UI A/B 테스트컨텐츠 마케팅Activation (활성화) : 첫 핵심 행동을 통해..
https://velog.io/@arinlee/%ED%86%B5%EA%B3%84%ED%95%99-%EB%9D%BC%EC%9D%B4%EB%B8%8C-%EC%84%B8%EC%85%98-3%ED%9A%8C%EC%B0%A8 [통계학] 라이브 세션 3회차_t-r검정, 카이제곱검정 실습해보기contentst-test 실습하기카이제곱검정 실습하기summaryt-test 실습하기:표본의 평균 비교/ 모집단의 분산을 모를때 연속형 자료에 사용한다.T-TEST: 가설 설정하기가설 설정귀무가설: 남성과 여성의 평균velog.io Tableau 1,2 주차 강의 완강.머신러닝 과제 필수과제 1,2,3,4 풀이완.
PPT 들어갈 내용 및 파이썬 파일 취합완료! 1. Project 달달 (달구벌에서 달리는 자동차 사고 예측)(주제: 대구 지역의 교통사고 시공간 및 환경 정보를 활용하여 사고위험도(ECLO)를 예측하는 AI 모델 개발) 2. 목차O bjective (목표)N ecessary data (데이터)A nalytics (*상관관계 안 나옴/ EDA: 탐색적 데이터 분석 (시각화만) / ML: 머신러닝 코드) I nterpretation (해석) (머신러닝 숫자가 잘 나왔다 - / 시각화를 통해 분석) R eport (보고) 3. Objective 4. Objective: 목표- 프로젝트의 목표: 대구 교통사고 피해예측을 위해 ECLO를 포함한 시공간 데이터를 학습시킨 시공간데이터만으로 예측가능한 회귀모델을 ..
1. 전처리2. 파생변수 (시간정보)3. 파생변수 (공간정보) train_df_9 (동별 대구 CCTV, 보안등, 어린이 보호구역, 주차장 갯수/ 동별 사망자수, 중상자수, 경상자수, ECLO/ 고속도로유무/ 도로유형)test_df_9 (동별 대구 CCTV, 보안등, 어린이 보호구역, 주차장 갯수/ 동별 사망자수, 중상자수, 경상자수, ECLO/ 고속도로유무/ 도로유형) 4. 모델링test_x_1 = test_df_9.drop(columns=['ID','군구','사고유형시']).copy() train_x_1 = train_df_9[test_x_1.columns].copy()train_y_1 = train_df_9['동사망자수'].copy()train_y_2 = train_df_9['동중상자수'].cop..
#df8 편집(주차장 정보)df8 = pd.read_csv("대구 주차장 정보.csv",encoding="EUC-KR")df8 = pd.read_csv("대구 주차장 정보.csv",encoding="EUC-KR")address_pattern = r"(\S+) (\S+) (\S+)"df8[["addr_1", "addr_2", "addr_3"]] = df8["소재지지번주소"].str.extract(address_pattern)df8_edit=df8.reset_index(drop=True)df8_edit_1=df8_edit.groupby(["addr_1", "addr_2", "addr_3"]).count()df8_edit_2=df8_edit_1['주차장관리번호'].reset_index()df8_edit_3=d..
프로젝트 달달 날짜계획11/29(금)-2PM 주제 정하기-9PM 계획서 제출12/2(월)-데이터전처리(이상치,결측치) 완성-머신러닝12/3(화)-시각화 완성12/4(수)-PPT들어갈 내용정리12/5(목)-PPT완성12/6(금)-발표스크립트 준비-발표영상녹화 및 투표-9PM PPT, 발표영상 제출12/9(월)-발표(10분) [제출물]PPT Python 코드 정리 파일대표 썸네일: 1280픽셀 * 720픽셀 (16:9 종횡비) ** 이번 발표 유의사항 ETA (Estimated Time of Arrival’ 도착예정시간 마감기한 맞추기 주제!ONAIR 순서발표 추가 평가항목: 기획안과 최종 결과물의 일치여부1.분석목표 일치/ (설정분석목표와 결과물 잘 맞는지 평가)2.분석방법 적용/ (제시된 분석방법이 ..
0. UCI 데이터 호출을 위한 패키지 설치pip install ucimlrepo 1. 기본 라이브러리 가져오기 import numpy as npNumpy (Numerical Python) : 파이썬의 고성능 수치계산을 위한 라이브러리- 여러 형태의 벡터 및 행렬연산과 나아가 여러 수학적인 기능들을 빠르고 간편하게 사용할 수 있는 기능제공.https://modulabs.co.kr/blog/python-numpy/ import pandas as pdPandas : 1차원(Sesries), 2차원 (Dataframe) 구조 데이터 용. - Numpy를 기반으로 다른 라이브러리들과 호환되게 설계. https://1000yun.tistory.com/2 import matpotlib.pyplot as plt- ..