rubus0304 님의 블로그
[데이터 전처리] 홀로서기 (H.W_예정) 본문
01. 데이터 분석가로 홀로서기
1) 모르는 함수가 나왔다.. 어떻게 하지?
☑️ 경력자도 사실… 잘 모른다.
- 많은 연습과 구글링만 있다면 걱정하지말자
- 하루 10분 pandas를 써봅시다
- 10분 판다스는 pandas에서 주로 활용되는 함수 등을 쉽게 사용가능하도록 설명되어있습니다.
- 저는 10분 pandas를 그냥 맹목적으로 받아쓰기 하듯 코드를 적어보았습니다
- 결국 코딩도 하나의 언어라서 단순히 암기하는 것이 아니라 자주 사용해야합니다
- 10 minutes to pandas — pandas 2.1.2 documentation
- 구글링은 나의 멘토
- 모든 답은 구글에 있다 라는 말이 있습니다
- 여러분이 모르는 함수나 기억나지 않는 상황에 처했을때, 구글에 물어보는 것을 습관화해보세요
- 처음에는 주변에 잘아는 친구들이나 선배들한테 물어볼 수 있지만, 현업에서 일을 시작하고부터 스스로 검색해보고 배워가는 습관을 들이면서 오히려 학습하는 속도가 빨라졌습니다
- 하루 10분 pandas를 써봅시다
2) 데이터 전처리/시각화하는 과정에서 우리는 방향성을 가져야합니다.
☑️ 데이터 전처리와 시각화를 배우고 나서,
-
- 몰입해서 python코드를 작성하다보면, 코드 로직에만 몰두하게 되면서 정작 무엇을 얻고자 했었지? 라는 의문을 가진 적이 있었을 겁니다 !
- 더군다나 양이 많고 복잡한 데이터를 다루면 더욱 어려워질거에요
- 내가 무엇을 해결하기 위해 전처리를 하고, 어떤 인사이트를 얻기 위해 시각화를 할지 사전에 고민하고 메모해둔다면 , 여러분은 결코 방향성을 잃지 않을 것입니다 !!
- 아직 습관화되지 않아서 어려움을 겪고 계시다면, 연습을 통해 꼭 얻으시길 바랍니다전처리와 시각화를 실제로 실습해보면서 무엇을 느끼셨나요?
💡 전처리와 시각화하기 전에, 내가 무엇을 위해 데이터를 확인할 것인가 메모하는 습관을 들이세요 !
3) 다양한 시각화 라이브러리&툴
☑️ 다양한 데이터 시각화 라이브러리&Tools
1. Pandas 라이브러리
데이터 시각화 툴
1. Tableau:
- 설명: Tableau는 사용자가 데이터를 시각적으로 탐색하고 이해하기 쉽도록 도와주는 시각화 도구입니다. 대화형 대시보드 및 시각화를 생성하고, 다양한 데이터 소스와 연결하여 분석 및 시각화를 제공합니다.
- 특징: 직관적인 UI, 다양한 시각화 옵션, 대규모 데이터 처리, 대시보드 공유 및 협업 기능, 실시간 분석 등을 제공합니다.
2. Google Data Studio:
- 설명: Google Data Studio는 구글의 무료 데이터 시각화 도구로, 다양한 데이터 원본을 연결하고 시각화하여 사용자 정의 대시보드를 생성할 수 있습니다.
- 특징: 간단한 사용법, 다양한 데이터 소스와의 연동, 실시간 데이터 업데이트, 사용자 지정 가능한 대시보드 및 보고서 생성 등을 제공합니다.
3. Amazon QuickSight:
- 설명: Amazon QuickSight는 AWS에서 제공하는 비즈니스 인텔리전스 및 시각화 도구입니다. 빠른 시간 내에 대화형 시각화를 생성하고 AWS 데이터와 연결하여 분석을 수행합니다.
- 특징: 빠른 대시보드 구축, 스마트 기능을 활용한 데이터 분석, 클라우드 기반의 시스템으로 확장 가능한 기능 등을 제공합니다.
02. 내가 생각하는 데이터 분석가 정의하기
데이터 분석가란?
☑️ 데이터 분석가에 대해서 다시 한 번 생각해봅시다
- Python , SQL 스킬은 매우 쉽고, 반복하다보면 어느새 잘해진 내 모습을 발견하게 됩니다.
- 즉, 스킬은 배우면 되고 반복학습하면 늘기 마련입니다.
- 그러나 여러분이 정말 하고 싶은 데이터 분석은 방향성에 따라 매우 다르고
- 그것을 위한 스킬 또한 다르다 라는 것을 말씀드리고 싶습니다.
ex) 예를 들면,
-
- 비즈니스 분석가⇒ 스킬보다 비즈니스 현상에 대한 이해와 인사이트가 더욱 중요함
- ⇒ 현업에서는 python을 다루지 않는 경우가 대부분.
-
- 데이터 사이언티스트⇒ AI에 대한 기본 지식이 필요함(논문을 읽고 해석하며 실제업무에 반영할 수 있는 능력 필요)
- ⇒ python 스킬은 필수
여러분이 되고 싶은 데이터 분석가란?
☑️ 여러분이 되고 싶은 데이터 분석가는 누구인가요?
- BA , PA , BI , DS , DA … 등
- 비즈니스 분석가
- 주로 비즈니스 문제를 이해하고 해결하기 위해 데이터를 분석합니다.
- 비즈니스 프로세스 및 요구 사항을 파악하고, 데이터 기반으로 의사 결정을 지원합니다.
- 주로 업무 프로세스 개선, 비즈니스 모델 분석, 요구 사항 관리 등을 수행합니다.
- 프로덕트 분석가
- 제품이나 서비스의 성과를 평가하고 개선하기 위해 데이터를 분석합니다.
- 사용자 행동 및 제품 성능과 관련된 데이터를 분석하여 제품 개선에 기여합니다.
- 주로 제품 경험과 사용자 행동에 대한 분석을 수행하며, A/B 테스트, 사용자 경로 분석 등을 담당합니다.
- 데이터 분석가
- 주로 정형 데이터를 분석하여 기업의 의사 결정을 지원합니다.
- 데이터베이스, 스프레드시트 등에서 데이터를 추출하고, 데이터를 정제하여 보고서 및 시각화를 생성합니다.
- 주로 기술적인 기술이 필요하며, SQL, Excel, 데이터 시각화 등을 활용하여 업무를 수행합니다.
- BI 분석가
- 기업의 비즈니스 인텔리전스 플랫폼과 도구를 사용하여 데이터를 시각화하고 보고서를 작성합니다.
- 주로 기업 내부 데이터를 시각화하고, 이를 통해 의사 결정에 필요한 정보를 제공합니다.
- BI 도구 (Tableau, Power BI 등)를 사용하여 대시보드를 구축하고, 데이터 시각화 및 보고서 작성을 담당합니다.
- 데이터 사이언티스트
- 주로 데이터를 활용하여 예측, 패턴 발견, 복잡한 분석을 수행하여 비즈니스 문제를 해결합니다.
- 통계, 머신러닝, 딥러닝 등의 기술과 알고리즘을 사용하여 데이터를 분석하고 모델을 구축합니다.
- 데이터 수집, 전처리, 모델링, 평가 및 해석을 포함한 end-to-end 데이터 분석 작업을 수행합니다.
- 비즈니스 분석가
💡 여러분은 어떤 데이터 분석가가 되고 싶으신가요? 프로덕트 분석가, 데이터 분석가 (글로벌 마켓팅 분석)
HW. 4주차 숙제 해설
1) 문제 살펴보기
☑️ 공공데이터 : 서울시 코로나 일일 확진 현황
서울시 코로나 일일 확진 현황 데이터를 활용해서 데이터를 시각화하고 시각화한 자료를 해석하여 인사이트를 도출해보세요.
https://www.data.go.kr/data/15112163/fileData.do
☑️ 공공데이터 : 전국 아파트 부동산 분양가
전국 아파트 부동산 분양가 데이터를 활용해서 데이터를 시각화하고 시각화한 자료를 해석하여 인사이트를 도출해보세요.
https://www.data.go.kr/data/15061057/fileData.do
https://teamsparta.notion.site/6e3bf3425a6b482f81ff3fa7f5ead7e4#254d3cec9c874b9598cae7000243cbad
'강의 > 데이터전처리(Pandas)' 카테고리의 다른 글
[데이터 전처리 4주차] 강의요약 (H.W_예정) (0) | 2024.10.24 |
---|---|
[데이터 전처리 3주차] 강의내용 (H.W_예정) (3) | 2024.10.24 |
[데이터 전처리 1-2주차] 강의요약 (3) | 2024.10.21 |