rubus0304 님의 블로그
[Article Study ⑦] 데이터 속 거짓말 발견하기 (시각화 시리즈 마지막) 본문
https://yozm.wishket.com/magazine/detail/1821/
- 요약 : 데이터 시각화를 이용한 거짓말을 발견하는 방법
1) 막대그래프
-기준선이 0 인지 확인 (기준선이 다른 경우, 값 차이 커짐)
-Y축 확인 (물결표시로 높이 축약하는 경우존재)
2) 선그래프 (시간에 따른 연속적 변화 표시 특징)
-변화를 보여주는게 주 목적이므로 특별한 경우 제외하고 기준선 ‘0’으로 두지 않음. 대신, 스케일에 따라 다르게 인식되므로 두 개의 Y축을 하나의 그래프에 사용 지양 사실 왜곡이 클 수 있는 만큼 나누어 정확히 표현하는 것이 좋음.
-누적값 으로 부풀리는 수법 주의(분기별 실제 판매량으로 보면 판매량은 크게 지속적으로 상승하지 않음)
3) 파이차트 (전체 합 100% 기준으로 각 부분의 구성 비율, 제한적 쓰임)
-3D 피하기 (각도에 따라 보이는 면적 크기 달라보이므로 지양.)
4) 지도
-데이터를 추출한 시점이 다를 수 있음
-추출한 데이터가 동일한 비율로 추출된게 아닐 경우 데이터 정확도 떨어짐
-맥락이 중요: 이미 대상이 아닌 곳 까지 누적하여 보여줄 수 있음 이로인해 이 시각화가 공유되는 시점의 현황보다 과장된 정보가 담길 수 있음.
- 주요 포인트 : 시각화는 눈을 통해 뇌에 직관적으로 인식이 되는 정보인 만큼 왜곡현상에 일어날 수 있다. 따라서, 작성자 입장에선 설득을 위한 필요에 따라 시각화 자료를 강조하는데 쓰는 방법을 고려할 수 있고, 사용자 입장에선, 막대, 선, 파이차트, 지도 등의 시각화 자료를 볼 때 비판적으로 살펴 정확한 정보를 취득하는 것이 필요하다.
- 핵심 개념 : 시각화를 통한 데이터 왜곡현상
- 용어 정리 :
-막대그래프 (Bar chart) : 어떤 변수의 값을 기준선으로부터의 막대 길이로 나타낸 그래프. 불연속적인 데이터를 다룸
-선그래프 (Line char) : 시간에 따른 연속적인 변화를 보여주는 데이터를 표현
-파이차트 (Pie chart) : 어떤 변수의 전체 합을 100%로 했을 때, 각 부분의 구성 비율을 보여주는 데 쓰임. 하나의 원을 나누는 모양이기 때문에, 쓰일 수 있는 데이터의 종류에 한계가 있음
-지도: 위치 정보를 가지는 데이터를 시각화할 때 많이 사용. 날씨, 선거 결과, 인구 이동 등 보여주기 위해 사용
- 실무 적용 :
- 관련 사례 : 세로축 변경을 통한 왜곡 사례
공무원 봉급 안정 vs 공무원 봉급 상승
https://blog.naver.com/businessinsight/221918586252
- 가상 시나리오 :
'Data Analyst > article' 카테고리의 다른 글
[Article Study ⑨] 사용자 데이터를 효과적으로 분석하는 법 (1) | 2024.10.29 |
---|---|
[Article Study ⑧] [번역] 더 나은 대시보드 디자인을 위한 10개명 (5) | 2024.10.24 |
[Article Study ⑥] 직관적인 데이터 시각화 만들기 (1) | 2024.10.17 |
[Article Study ⑤] 데이터 시각화는 왜 중요할까? (3) | 2024.10.15 |
[Article Study ④] 데이터 리터러시(Data Literacy)를 올리는 방법 (4) | 2024.10.11 |