데일리 미션/Article

Article : 데이터 시각화 101 - ③ 데이터 속 거짓말 발견하기

pipiiiiii 2023. 12. 13. 17:38

https://yozm.wishket.com/magazine/detail/1821/

 

데이터 시각화 101: ③데이터 속 거짓말 발견하기 | 요즘IT

간혹 직관적으로 이해된 시각화가 부정확한 정보를 전달하기도 하고, 시각적으로 오해를 불러일으키기도 합니다. 그 때문에 우리는 이러한 문제점이 왜 일어나는지 이해하고, 데이터 시각화

yozm.wishket.com

 

<아티클 내용 요약>

막대그래프를 특히 주의하자

- 막대그래프는 어떤 변수의 값을 기준선으로부터의 막대 길이로 나타낸 그래프를 뜻한다. 막대그래프는 불연속적인 데이터를 다룬다. 

  •  기준선이 '0'인지 확인하기
    막대그래프는 높이가 변수의 값으로 인식되기 때문에 기준선을 '0'으로 두는 것이 매우 중요하다. 하지만 기준선을 '0'으로 두지 않아 왜곡된 정보를 전달하는 경우도 많다. 
  • Y축 살펴보기 

 

선 그래프는 스케일이 중요하다

- 선 그래프는 시간에 따른 연속적인 변화를 보여주는 데이터를 표현할 때 주로 쓰인다. 변화를 보여주는 것이 목적이기 때문에 특정한 경우를 제외하고는 기준선을 '0'으로 두지 않는다. 다만, 그 변화가 스케일에 따라 다르게 인식되므로 스케일을 사용하는 데 주의해야 한다. 

  • 두 개의 Y축을 멀리하자 
    두 개의 다른 Y축을 가지는 그래프를 겹쳐서 그리는 경우, 스케일에 따라 완전히 다른 해석이 나올 수 있다. 두 개의 Y축을 하나의 그래프로 사용하는 것은 사실의 왜곡이 클 수 있는 만큼 반드시 지양해야 한다. 대신 각각 두 개의 그래프로 나누어 표현할 수 있다. 
  • 누적값으로 눈속임하다
    누적 그래프를 이용하여 결괏값이 상승세인 것처럼 표현할 수 있어 주의해야 한다. 

 

파이 차트를 써야 할까?

- 파이 차트는 어떤 변수의 전체 합을 100%로 했을 때, 각 부분의 구성 비율을 보여주는 데 주로 쓰인다. 파이 차트가 하나의 원을 나누는 모양이기 때문이다. 때문에 파이 차트에 쓰일 수 있는 데이터의 종류에는 한계가 있다.

  • 전체의 합이 100% 인지 확인하자
    파이 차트로 나타냈을 때 전체의 합이 100%가 넘는 경우도 있다. 합을 꼭 확인하자. 
  • 3D는 피하자
    파이 차트를 3D로 만들면 동일한 값의 데이터도 시점에 따라, 각도에 따라 보이는 면적의 크기가 달라 데이터값에 대한 왜곡이 일어난다. 

 

오해를 불러일으키는 지도

- 위치 정보를 가지는 데이터를 시각화할 때 지도가 많이 활용된다. 그러나 이런  지도를 통해 거짓말이 가능하다. 

  • 트럼프의 대선 승리 지도
    도널드 트럼프가 2016년 대선 득표 지도를 트위터에 공유했지만 그 지도는 여러 가지 면에서 사실을 왜곡한 문제가 있었다. 하나는 실제 2016년 대선 득표 지도와 다른 것인데, 아마 트럼프가 공유한 지도는 득표가 마감되기 전 한 시점을 캡처한 것으로 예상된다. 즉, 데이터의 출처가 잘못된 것이다. 또 하나는 시각화 방법이다. 카림은 2016년 대선 결과를 투표수에 비례하는 점으로 표시된 지도를 공유했는데 이는 투표수에 따른 결과를 좀 더 정확하게 보여주었다. 
  • 맥락이 필요하다. 
    시각화는 직관적으로 이해되기 때문에 그 자체로 영향력이 클 수 있다. 때문에 시각화가 어떠한 배경에서 어떤 데이터를 이용해서 만들어졌는지 꼭 살펴봐야 한다. 

 

데이터 왜곡에 주의하기

- 데이터가 시각화되어 전달되면, 우리의 뇌는 이 시각 정보를 직관적으로 인석하여 해석한다. 하지만 직관적으로 이해된 정보가 실제와 다른 부정확한 정보를 전달하기도 하고, 시각적으로 오해를 불러일으키기도 한다. 

- 데이터 시각화는 쉽게 이해되고, 그 영향력이 큰 만큼 이를 비판적으로 바라보는 태도가 매우 중요하다. 

- 데이터 시각화를 만드는 사람뿐 아니라, 이를 통해 정보를 얻는 독자들도 시각화를 통해 받아들인 정보가 정확한지, 왜곡된 부분인 없는지 항상 의문을 가지고 시각화를 이해하려는 태도가 필요하다.  

 

<알게 된 개념>

- 시각화 자료를 통해 눈속임을 할 수 있다는 것과 그동안 나도 모르게 눈속임에 속았을 수 있다는 것을 깨달았다. 

- 정보의 중요성과 그 정보로 시각화를 표현할 때는 진실되게 해야 한다는 것을 느꼈다.