목록강의/머신러닝 (9)
rubus0304 님의 블로그
0. UCI 데이터 호출을 위한 패키지 설치pip install ucimlrepo 1. 기본 라이브러리 가져오기 import numpy as npNumpy (Numerical Python) : 파이썬의 고성능 수치계산을 위한 라이브러리- 여러 형태의 벡터 및 행렬연산과 나아가 여러 수학적인 기능들을 빠르고 간편하게 사용할 수 있는 기능제공.https://modulabs.co.kr/blog/python-numpy/ import pandas as pdPandas : 1차원(Sesries), 2차원 (Dataframe) 구조 데이터 용. - Numpy를 기반으로 다른 라이브러리들과 호환되게 설계. https://1000yun.tistory.com/2 import matpotlib.pyplot as plt- ..
https://teamsparta.notion.site/4-883fc70db88e4263b706ea52f2e150c9 4. 딥러닝 | Notion1. 학습목표teamsparta.notion.site 2022년 12월 ChatGPT가 등장한 이래로 딥러닝에 대한 관심에 더욱 가속화 되었어요. 도대체 딥러닝이 뭐길래 그렇게 온 세상을 바꿀 것 처럼 얘기 할까요? 머신러닝에서 배운 기본을 바탕으로 딥러닝에 대해서 알아 봅시다.
평균은 이상치에 취약. import pandas as pdimport seaborn as snsimport matplotlib.pyplot as plt iris_df = sns.load_dataset('iris')iris_df.head(3) iris_df.info() sns.scatterplot(data = iris_df, x = 'sepal_length', y = 'sepal_width') sns.scatterplot(data = iris_df, x = 'sepal_length', y = 'sepal_width', hue = 'species') iris_df2 = iris_df[['sepal_length','sepal_width','petal_length','petal_width..
import pandas as pdimport matplotlib.pyplot as pltfrom sklearn.preprocessing import LabelEncoderfrom sklearn.tree import DecisionTreeClassifier,plot_treetitaninc_df = pd.read_csv('C:/Users/82106/Desktop/데이터분석/강의/6.파이썬/4.머신러닝/ML/titanic/train.csv')titaninc_df.info() #Pclass: LabelEncoder#Sex: LabelEncoder#Age: 결측치-> 평균으로 대치하고 le = LabelEncoder()titaninc_df['Sex'] = le.fit_transform(titaninc_df[..
https://teamsparta.notion.site/1-8048e291815143c3bfc90b5848e8dff0 histogram: 수치형 자료 빈도 시각화방법: 연속형 분포를 나타내고 싶을 때, 데이터가 몰려있는 구간을 파악하기 쉬움Ex)고객들의 연령 분포를 파악 할 때x축: 수치형 자료y축: 자료의 빈도수 bullian indexing 추가 fillna (value) -> value 자리에 평균, 중앙, 최빈값 넣을 수 있음 isna ( ) 는 비어있는 값notta ( ) 비어있지 않은 값 ☑️ 범주형 데이터 전처리 - 인코딩(Encoding) 인코딩: 어떤 정보를 정해진 규칙에 따라 변환하는 것 (범주형 자료에 대한 전처리) 우리가 ..
https://teamsparta.notion.site/08d443adff404876b5dde2dc9ca57c63 머신러닝의 이해와 라이브러리 활용 기초 | Notion실습 정답 자료teamsparta.notion.site https://teamsparta.notion.site/3-fe9d135d7f3441ab97bd71a4c224391c 3. 분류분석 - 로지스틱회귀 | Notion1. 학습목표teamsparta.notion.site https://www.kaggle.com/c/titanic/data Titanic | NoviceKaggle profile for Titanicwww.kaggle.com pandas.pydata.org pd.pivot_table(titaninc_df, index =..
보호되어 있는 글입니다.
보호되어 있는 글입니다.
https://teamsparta.notion.site/1-328d08b2df7e47fba43416f7f8238bbc 1. 머신러닝의 기초 | Notion목차teamsparta.notion.site 머신러닝 정의: 관측된 패턴을 기반으로 의사 결정을 하기 위한 알고리즘 AI: 인간의 지능을 요구하는 업무를 수행하기 위한 시스템Machine Learning: 관측된 패턴을 기반으로 의사 결정을 하기 위한 알고리즘Deep Learning: 인공신경망을 이용한 머신러닝Data science: AI를 포괄하여 통계학과 컴퓨터공학을 바탕으로 발전한 융합학문Data Analysis: 데이터 집계, 통계 분석, 머신러닝을 포함한 행위📌 머신러닝(Machine Learning, ML)은기술 통계 등을 통하여 집계..