목록2024/10/14 (8)
rubus0304 님의 블로그
❗ 배울 내용파이썬 설치출력문 및 변수리스트, 튜플, 딕셔너리조건문반복문함수, 클래스파이썬 유용한 문법들 데이터 분석의 모든 과정에서 사용설명데이터 불러오기, 저장하기 부터 시작해서 데이터 전처리, 데이터 시각화, 데이터 계산 등 모든 과정에서 파이썬 문법이 쓰이지 않는 곳이 없음목적데이터 분석을 파이썬으로 하기 위한 문법 이해결과물데이터 분석의 모든 과정 수행 기대효과데이터 관리 : 당장 데이터 분석을 위해 방대한 데이터들을 불러오고 저장하는 것은 가장 기본적인 과정 입니다. 이것부터 파이썬 문법을 사용하기 시작합니다.데이터 전처리 : 데이터를 분석하기 전 데이터의 문제가 있는지 살펴보고 데이터를 분석하기 좋게 전처리하는 과정이 필수적입니다. 이 과정에서 파이썬 문법을 사용합니다. (특히, Panda..
59. 자동차 대여 기록에서 대여중/ 대여가능 여부 구분하기 CAR_RENTAL_COMPANY_RENTAL_HISTORY 테이블에서 2022년 10월 16일에 대여 중인 자동차인 경우 '대여중' 이라고 표시하고, 대여 중이지 않은 자동차인 경우 '대여 가능'을 표시하는 컬럼(컬럼명: AVAILABILITY)을 추가하여 자동차 ID와 AVAILABILITY 리스트를 출력하는 SQL문을 작성해주세요. 이때 반납 날짜가 2022년 10월 16일인 경우에도 '대여중'으로 표시해주시고 결과는 자동차 ID를 기준으로 내림차순 정렬해주세요. SELECT car_id, case when car_id in (select car_id fro..
수식보단 내용이해 중심으로! 남 100 / 여 200/ 노인 300 - 모집단 반영 잘 된건지 의문 반영-> 비례 층화 추출법 분포를 반영해서 남 100/ 여 200/ 노인 300 에 맞춰 남 1: 여 2: 노인 3 이렇게 추출 하여 비례 맞춤. -> 불비례 층화 추출법 :비례 상관없이 동일 숫자 추출 왜 구분 해야하느냐 : 데이터의 척도에 따라서 분석 방법을 달리하기 위해! 기술통계를 통해서 데이터를 파악하고 추리통계로 넘어가기는 것 !! 분산 - 얼마나 평균에서 떨어져 있는지 - 다 더하면 )이 되버림 - 양수라면 양의 선형 관계 음수라면 음의 선형 관계 확률과 확률분포 -> 알아야 뒤에 나오는 내용 이해가능 주사위를 던질 때 홀수가 나오면 짝수 나올 ..
데이터 마트와 데이터 웨어하우스 구분 데이터 마트 개발 - 패키지들 안 봐도 된다 (시험에는 안 나옴)) 이론 위주로 SQLDF = SQL 을 R에서 사용 가능하게 해주는 패키지 단순 확률 대치법: 전체 평균이 아닌 그 근처에 값 평균값 (KNN - K 군집) 다중 대치법: 값에 다양한 값 대치해서 데이터 셋 여러개 만들어보는 것 이상값: 보통은 제외하고 분석 (결과도출에 방해하는 값으로 인식// but, 무조건 제외 노노. Q1 1사분, Q2 2사분 (중앙값), Q3 3사분
리스트 'A', 2, True 다 묶을 수 있다.L [[3]] 는 L리스트의 3번째 원소 비교 연산지의 값은 True or False 임 > a == 'abc' [1] TRUE> a != 'abcdefg' [1] TRUE> b > 'adsp' [1] FALSE> number1 [1] TRUE> is.na(logical) [1] TRUE> is.null(NULL) [1] TRUE > 7+3 [1] 10> 7-3 [1] 4> 7*3 [1] 21> 7/3 [1] 2.333333> 7%/%3 [1] 2> 7%%3 [1] 1 # 만약 벡터의 길이가 동일하지 않은 경우, 원소가 많은쪽이 기준이 된다 x = c(1, 2, 3) y = c(1, 2, 3, 4, 5, 6) x + y # 2, 4, 6, 5..
테이블 확인 할 때 너무 크면 limit 으로 끊어서 어떻게 생겼는지 확인 ! Fact table (노란 테이블)City = 1dimention 테이블 (파란 테이블)1= 한국2= 일본3= 미국 select * (아스트릭스, 아스카, 모든 값) 다 가져오기 다시 한 번, 조인을 하는 이유!조인함수를 통하여, 데이터분석가는 데이터를 효율적으로 검색하고 처리할 수 있게 됩니다.들에게 규칙성을 부여하여 각 저장창고에 저장했었죠? 여기서 이 규칙을 통해, 데이터 간 중복은최소화 되게 됩니다. 이렇게 효율적으로 저장된 각 창고를 연결해주는 것이 JOIN 이예요!그렇다면 테이블은 왜 나눠져 있을까요? 1회차 강의의 RDBMS 를 떠올려 볼게요.각각의 데이터 조인은 최소 두 개 이상의 테이블을 결합하여 하나..
1. 두 수의 차 정수 num1과 num2가 주어질 때, num1에서 num2를 뺀 값을 return하도록 soltuion 함수를 완성해주세요. [Python] def solution(num1, num2): return num1 - num2 2. 두 수의 곱정수 num1, num2가 매개변수 주어집니다. num1과 num2를 곱한 값을 return 하도록 solution 함수를 완성해주세요. [Python]def solution(num1, num2): return num1 * num2 3. 몫 구하기 정수 num1, num2가 매개변수로 주어질 때, num1을 num2로 나눈 몫을 return 하도록 solution 함수를 완성해주세요. [Python]def solut..
1. 데이터 리터러시 강의(2시간) 2. 파이썬 종합반 강의 (서정욱 튜터님)Python 배우는 이유. -> 간결함+생산성 +오픈소스- 높은 연동성, 방대한 라이브러리, 인간다운 언어 (User friendly)- 직관적이며 쉽게 입문이 가능한 언어 (처음 파이썬 - 다음 언어로 넘어감) 바라는 것- 프로그래밍 입문 수준 코딩 지식 및 파이썬 라이브러리 활용능력 구글 Colab - 업무에서 많이 활용Jupyter Notebook - 업무에서 많이 활용Pycharm - 개발자Visual Studio - 개발자 온보딩 주차 5팀 - 이예림, 김주호, 황지호 B 프로그래밍 기초 주차 5팀 - 천우석, 이지민, 김현승, 김호림