이번에 데이터리안에서 진행하는 데벨챌(데이터넥스트레벨챌린지) 3기에 참여하게 됐어요.
* 데벨챌이란? 데이터 분석에 도움이 될만한 책을 읽고, 기록하고 공유하는 챌린지
데벨챌에 참여하게 된 이유는 '함께'에 있습니다.
항상 책을 혼자 읽고 기록만 했는데, 사람들과 함께 책을 읽고 생각을 공유할 수 있다니 너무 매력적으로 다가와서 바로 신청했답니다.
이번 챌린지에서 선정된 책은 '새빨간 거짓말, 통계'입니다. 총 10 part로 구성되어 있고, 3주 간 나누어 읽고 기록하여 공유하면 돼요.
오늘은 1 ~ 3 part 부분에서 가장 기억에 남는 부분을 기록하려 해요.
당신도 속을 수 있다 !
책에는 뉴스나 마케팅에서 통계를 바탕으로 사람들을 속이는 이야기가 나옵니다.
그런데 아이러니한 것은 '속이지만, 거짓말은 하지 않는다'는 거죠.
첫 번째로는 그래프를 통해 속이는 예시를 보여드릴게요.
아래 사진을 보여주며, 'A와 B의 매출 차이'라고 제목이 달린다면 여러분들은 어떤 생각을 하실 것 같나요?
아마 대부분은 매출 차이가 많이 난다고 생각하실 거예요.
하지만, 누군가 당신을 속이기 위해 꼼수를 사용해서, 위 사진을 아래 사진 빨간 박스 부분을 확대해서 보여준 것이라면요?
그러면 이야기는 달라질 것입니다. "뭐야 A와 B의 매출 차이가 별로 안 나네" 라고요.
이러한 꼼수에 넘어가지 않기 위해서 우리는 X 축과 Y 축을 통해 객관적인 사실을 바탕으로 그래프를 해석해야 하는 것이죠.
이번엔 반대로 그래프를 보지 않고 대략적인 수치만으로 잘 못된 판단을 내리는 예시를 보여드릴게요.
어느 도시의 평균 온도가 15.7도래
도시 평균 온도가 15.7도래요. 듣기만 해도 선선하고 좋은 날씨로 느껴집니다.
하지만, 이는 그래프를 보지 않고 판단한 것이죠. 만약 아래와 같이 사막처럼 편차가 큰 지역이라면 이야기는 크게 달라집니다.
평균이란 단어를 들었을 때 우린 질문해야 합니다.
그래서 편차는 ?