rubus0304 님의 블로그

[Article Study ⑦] 데이터 속 거짓말 발견하기 (시각화 시리즈 마지막) 본문

Data Analyst/article

[Article Study ⑦] 데이터 속 거짓말 발견하기 (시각화 시리즈 마지막)

rubus0304 2024. 10. 22. 19:48

https://yozm.wishket.com/magazine/detail/1821/

 

데이터 시각화 101: ③데이터 속 거짓말 발견하기 | 요즘IT

간혹 직관적으로 이해된 시각화가 부정확한 정보를 전달하기도 하고, 시각적으로 오해를 불러일으키기도 합니다. 그 때문에 우리는 이러한 문제점이 왜 일어나는지 이해하고, 데이터 시각화

yozm.wishket.com

 

 

  • 요약 : 데이터 시각화를 이용한 거짓말을 발견하는 방법

1) 막대그래프

-기준선이 0 인지 확인 (기준선이 다른 경우, 값 차이 커짐)

-Y축 확인 (물결표시로 높이 축약하는 경우존재)

 

2) 선그래프 (시간에 따른 연속적 변화 표시 특징)

-변화를 보여주는게 주 목적이므로 특별한 경우 제외하고 기준선 ‘0’으로 두지 않음. 대신, 스케일에 따라 다르게 인식되므로 두 개의 Y축을 하나의 그래프에 사용 지양 사실 왜곡이 클 수 있는 만큼 나누어 정확히 표현하는 것이 좋음.

-누적값 으로 부풀리는 수법 주의(분기별 실제 판매량으로 보면 판매량은 크게 지속적으로 상승하지 않음)

 

3) 파이차트 (전체 합 100% 기준으로 각 부분의 구성 비율, 제한적 쓰임)

-3D 피하기 (각도에 따라 보이는 면적 크기 달라보이므로 지양.)

 

4) 지도

-데이터를 추출한 시점이 다를 수 있음

-추출한 데이터가 동일한 비율로 추출된게 아닐 경우 데이터 정확도 떨어짐

-맥락이 중요: 이미 대상이 아닌 곳 까지 누적하여 보여줄 수 있음 이로인해 이 시각화가 공유되는 시점의 현황보다 과장된 정보가 담길 수 있음.

  • 주요 포인트 : 시각화는 눈을 통해 뇌에 직관적으로 인식이 되는 정보인 만큼 왜곡현상에 일어날 수 있다. 따라서, 작성자 입장에선 설득을 위한 필요에 따라 시각화 자료를 강조하는데 쓰는 방법을 고려할 수 있고, 사용자 입장에선, 막대, 선, 파이차트, 지도 등의 시각화 자료를 볼 때 비판적으로 살펴 정확한 정보를 취득하는 것이 필요하다.

 

  • 핵심 개념 : 시각화를 통한 데이터 왜곡현상
  • 용어 정리 :

-막대그래프 (Bar chart) : 어떤 변수의 값을 기준선으로부터의 막대 길이로 나타낸 그래프. 불연속적인 데이터를 다룸

 

-선그래프 (Line char) : 시간에 따른 연속적인 변화를 보여주는 데이터를 표현

 

-파이차트 (Pie chart) : 어떤 변수의 전체 합을 100%로 했을 때, 각 부분의 구성 비율을 보여주는 데 쓰임. 하나의 원을 나누는 모양이기 때문에, 쓰일 수 있는 데이터의 종류에 한계가 있음

 

-지도: 위치 정보를 가지는 데이터를 시각화할 때 많이 사용. 날씨, 선거 결과, 인구 이동 등 보여주기 위해 사용

 

 

  • 실무 적용 :
  • 관련 사례 : 세로축 변경을 통한 왜곡 사례

공무원 봉급 안정 vs 공무원 봉급 상승

https://blog.naver.com/businessinsight/221918586252

  • 가상 시나리오 :