목록2024/11/28 (4)
rubus0304 님의 블로그
0. UCI 데이터 호출을 위한 패키지 설치pip install ucimlrepo 1. 기본 라이브러리 가져오기 import numpy as npNumpy (Numerical Python) : 파이썬의 고성능 수치계산을 위한 라이브러리- 여러 형태의 벡터 및 행렬연산과 나아가 여러 수학적인 기능들을 빠르고 간편하게 사용할 수 있는 기능제공.https://modulabs.co.kr/blog/python-numpy/ import pandas as pdPandas : 1차원(Sesries), 2차원 (Dataframe) 구조 데이터 용. - Numpy를 기반으로 다른 라이브러리들과 호환되게 설계. https://1000yun.tistory.com/2 import matpotlib.pyplot as plt- ..
[Python] 머신러닝 특강 - 군집 분석 pip install yellowbrick 이거 해야함!! Z-score 평균으로부터 얼마나 떨어져Z-Score : 0 해당 데이터는 평균과 같음을 의미합니다. (=평균에서 떨어진 거리가 0) IQR 4분위로 나눈데이터의 25% 지점()과 75% 지점() 사이의 범위()를 사용합니다. 이를 벗어나는 값들은 모두 이상치로 간주 ------ 이 아래로 cluster 해보기 ------Isolation Forest -- 프로젝트에서 사용해보기 DBScan 밀도기반 표준화: 실험하고 더 잘 나오는 거로.... minmax scale 자주 안 사용모든 데이터 0과 1사이 배치 (표준화보다 정규화에 더 가까움) - 데이터의 분포를 가져갈 수 없기 때문 st..
https://teamsparta.notion.site/4-883fc70db88e4263b706ea52f2e150c9 4. 딥러닝 | Notion1. 학습목표teamsparta.notion.site 2022년 12월 ChatGPT가 등장한 이래로 딥러닝에 대한 관심에 더욱 가속화 되었어요. 도대체 딥러닝이 뭐길래 그렇게 온 세상을 바꿀 것 처럼 얘기 할까요? 머신러닝에서 배운 기본을 바탕으로 딥러닝에 대해서 알아 봅시다.
https://yozm.wishket.com/magazine/detail/1070/ 양질의 데이터를 판별하는 5가지 방법 : ① 데이터 양은 충분한가? | 요즘IT양질의 데이터 조건 첫 번째는 ‘충분한 양의 데이터’입니다. 최근 빅데이터라는 단어가 기승을 부리고 있으며 빅데이터는 기본적으로 방대한 양의 데이터를 의미합니다. 하지만 현실적으로yozm.wishket.com 요약 : 양질의 데이터를 판별하는 5가지 방법데이터의 수가 충분히 많음.데이터 자체의 오류가 적음.관계형데이터베이스형식을 잘 지킴.수치형 데이터 형식을 많이 보유.활용목적에 적합함.-보편적 특징일 뿐 모든 양질의 데이터가 철저히 지키는 것은 아니고, 낮은 품질의 데이터라고해서 안 갖춘 것도 아님. 다만, 판별하는데 도움.1)데이터의 양이..