목록2024/10 (82)
rubus0304 님의 블로그
데이터 마트와 데이터 웨어하우스 구분 데이터 마트 개발 - 패키지들 안 봐도 된다 (시험에는 안 나옴)) 이론 위주로 SQLDF = SQL 을 R에서 사용 가능하게 해주는 패키지 단순 확률 대치법: 전체 평균이 아닌 그 근처에 값 평균값 (KNN - K 군집) 다중 대치법: 값에 다양한 값 대치해서 데이터 셋 여러개 만들어보는 것 이상값: 보통은 제외하고 분석 (결과도출에 방해하는 값으로 인식// but, 무조건 제외 노노. Q1 1사분, Q2 2사분 (중앙값), Q3 3사분
리스트 'A', 2, True 다 묶을 수 있다.L [[3]] 는 L리스트의 3번째 원소 비교 연산지의 값은 True or False 임 > a == 'abc' [1] TRUE> a != 'abcdefg' [1] TRUE> b > 'adsp' [1] FALSE> number1 [1] TRUE> is.na(logical) [1] TRUE> is.null(NULL) [1] TRUE > 7+3 [1] 10> 7-3 [1] 4> 7*3 [1] 21> 7/3 [1] 2.333333> 7%/%3 [1] 2> 7%%3 [1] 1 # 만약 벡터의 길이가 동일하지 않은 경우, 원소가 많은쪽이 기준이 된다 x = c(1, 2, 3) y = c(1, 2, 3, 4, 5, 6) x + y # 2, 4, 6, 5..
테이블 확인 할 때 너무 크면 limit 으로 끊어서 어떻게 생겼는지 확인 ! Fact table (노란 테이블)City = 1dimention 테이블 (파란 테이블)1= 한국2= 일본3= 미국 select * (아스트릭스, 아스카, 모든 값) 다 가져오기 다시 한 번, 조인을 하는 이유!조인함수를 통하여, 데이터분석가는 데이터를 효율적으로 검색하고 처리할 수 있게 됩니다.들에게 규칙성을 부여하여 각 저장창고에 저장했었죠? 여기서 이 규칙을 통해, 데이터 간 중복은최소화 되게 됩니다. 이렇게 효율적으로 저장된 각 창고를 연결해주는 것이 JOIN 이예요!그렇다면 테이블은 왜 나눠져 있을까요? 1회차 강의의 RDBMS 를 떠올려 볼게요.각각의 데이터 조인은 최소 두 개 이상의 테이블을 결합하여 하나..
1. 두 수의 차 정수 num1과 num2가 주어질 때, num1에서 num2를 뺀 값을 return하도록 soltuion 함수를 완성해주세요. [Python] def solution(num1, num2): return num1 - num2 2. 두 수의 곱정수 num1, num2가 매개변수 주어집니다. num1과 num2를 곱한 값을 return 하도록 solution 함수를 완성해주세요. [Python]def solution(num1, num2): return num1 * num2 3. 몫 구하기 정수 num1, num2가 매개변수로 주어질 때, num1을 num2로 나눈 몫을 return 하도록 solution 함수를 완성해주세요. [Python]def solut..
1. 데이터 리터러시 강의(2시간) 2. 파이썬 종합반 강의 (서정욱 튜터님)Python 배우는 이유. -> 간결함+생산성 +오픈소스- 높은 연동성, 방대한 라이브러리, 인간다운 언어 (User friendly)- 직관적이며 쉽게 입문이 가능한 언어 (처음 파이썬 - 다음 언어로 넘어감) 바라는 것- 프로그래밍 입문 수준 코딩 지식 및 파이썬 라이브러리 활용능력 구글 Colab - 업무에서 많이 활용Jupyter Notebook - 업무에서 많이 활용Pycharm - 개발자Visual Studio - 개발자 온보딩 주차 5팀 - 이예림, 김주호, 황지호 B 프로그래밍 기초 주차 5팀 - 천우석, 이지민, 김현승, 김호림
1. 데이터분석 도메인 이해 (관심직무) 글로벌 마케팅 데이터 분석가 1)데이터활용 직무 기업 (경력)- 글로벌 마케팅 데이터 분석기업직무경력(주) 아티언스글로벌 마케팅 데이터 분석가 [주요업무]- 글로벌 기업 디지털 마케팅 데이터 마트 구축- 광고/마케팅 데이터 수집 기획 및 로직 수립- 법인 커뮤니케이션- 대시보드 기획 지원[자격요건]- 2년 이상의 디지털 마케팅 경험- 중급 이상의 영어실력 (영어미팅 가능)-SQL 초급[우대사항]- Tableau, DataStudio에 대해 기초 경험- 대기업 데이터 관련 프로젝트 경험- GA, Adobe 경험- GCP, Big Query 경험- 엑셀, PPT 활용 우수https://www.jobkorea.co.kr/Recruit/GI_Read/45642682?O..
[SQL] 예제로 익히는 SQL - 3회차 (notion.site) [SQL] 예제로 익히는 SQL - 3회차 | Notion[강의자료 PDF]teamsparta.notion.site 라이브세션 3회차 SQL과제 문제1 - 집계함수의 활용 조건1) 서버별, 월별 게임계정id 수를 중복값 없이 추출해주세요. 월은 첫 접속일자를 기준으로 계산해주세요. 월은 yyyy-mm의 형태로 추출해주세요.힌트: 월을 추출하는 방법→날짜는 string(문자열) 형식으로 저장되어 있으므로, 문자열을 자르는 함수를 사용해주시면 좋겠죠? 😃 (방법 1) date_format(컬럼, '%')select serverno,date_format(first_login_date,'%Y-%m') as 'm',count(distinct ..
https://yozm.wishket.com/magazine/detail/1632/ 데이터 리터러시(Data Literacy)를 올리는 방법 | 요즘IT화해팀은 일찍이 데이터의 중요성을 강조해왔는데요. 조직 전반적으로 데이터 활용력을 높이고, 데이터 의사결정 문화를 활성화하기 위해 많은 시도를 해왔습니다. 데이터를 거의 실시간에 가yozm.wishket.com 요약 : 화해 社의 데이터를 활용해 문제를 해결할 수 있는 ‘데이터 리터러시’ 활용하기 (문제 정의-솔루션-측정 지표 만들어내기)**1) 데이터/실험 기반 사고방식** **2) 분석 흐름대로 데이터를 탐색할 수 있는 환경**데이터 맵 -대시보드3) 이 과정을 도와주는 분석가들이 필요 - 데이터 분석가 -데이터플랫폼1) 데이터/실험 기반 사고방식(문..
58. 취소되지 않은 진로 예약 조회하기PATIENT, DOCTOR 그리고 APPOINTMENT 테이블에서 2022년 4월 13일 취소되지 않은 흉부외과(CS) 진료 예약 내역을 조회하는 SQL문을 작성해주세요. 진료예약번호, 환자이름, 환자번호, 진료과코드, 의사이름, 진료예약일시 항목이 출력되도록 작성해주세요. 결과는 진료예약일시를 기준으로 오름차순 정렬해주세요. (오답 - 테이블 여러개 붙이는거 배우기 전이여서 subquery로 붙여봤다.. 근데 그 전에 예약-환자 테이블 조인해서 조건 걸었을 때 해당환자는 1명 뿐이라 뭔가 이상했음. doctor 테이블과 진료과코드로 연결했는데 중복되서 나옴) select apnt_no, pt_name, pt_no, a.mcdp_cd, b.dr_name, apnt..
2과목 범위 적지만 지엽적인 내용 많음 별표 부터 1회독, 그 이후 굵직하게 잡히면 안쪽 디테일 채워가기 여기까지가 2과목이제 3과목 시작..! R코드 참고용으로만!1회독이고 프로그래밍 해본 적 없다 - R파트 넘어가고 통계부터 따라와도 (ADsP 시험가능) 프로그래밍 언어 배울 때1. 데이터 형식2. 기본 연산3. 조건문/ 반복문4. 활용 R언어는 어떻게 이해하고 실행하는가현실 -> 코드로 옮기는 거 스칼라: 하나의 값벡터: 하나의 값이 여러개 (a, b, c ...)행렬: 표 (2차원)배열: 리스트데이터 프레임 ' ' " " 홑은 홑 쌍따옴표는 쌍따옴표로 닫아야함 빗자루 누르면 console 다 지워짐 // 계산할 부분만 드래그하고 RUN Environmet 빗자루로 지우면..