코로나 19 데이터를 활용해서 시도별 일간 확진자 지도 시각화 및 지역별 누적 확진자 막대그래프로 나타내기
데이터는 질병관리청 홈페이지에서 얻었습니다. http://ncov.mohw.go.kr/
오늘 과제를 통해서 알게 된 것을 두 가지가 있어요. 첫 번째는 그룹화, 두 번째는 불연속형과 연속형
1) 그룹화하기
해당 시도 데이터 속에는 17개의 지역이 들어가 있습니다.
각 지역들을 수도권, 경상남도, 경상북도, 강원도, 충청, 호남 이렇게 새 그룹으로 만들어 주려고 할 때 사용한 방법이 '그룹화'입니다.
그룹화를 진행할 값을 오른쪽 누르고, 만들기에 들어가면 그룹화하기가 있습니다. 이를 눌러주면 아래와 같은 창이 뜹니다.
그룹을 만들고 싶은 지역을 윈도우면 ctrl를 통해 중복선택을 하고, 맥이라면 cmd를 통해 중복선택을 해줍니다.
그리고 아래 '그룹'을 누르고 원하는 그룹의 이름을 작성해주면, 새로운 그룹 필드가 생성됩니다.
2) 불연속형과 연속형
불연속형이란? 필드 색상이 파란색으로 되어 있고, 개별적으로 구분됩니다.
여기서 개별적이라는 말이 이해가 안 가실 수 있어요.
그래서 쉽게 말씀을 드라지면, A그룹 B그룹 C그룹 이런 느낌으로 각각 기준으로 분리되어 있다고 생각하시면 좋을 것 같아요!
연속형이란? 필드 색상이 초록색으로 되어 있고, 단절이 없고 끊어지지 않는 연속된 값이에요.
시각화에서 색상을 추가할 때 불연속형과 연속형의 차이를 확인할 수 있어요.
첫 번째 사진 속을 보면 연속형 필드를 색상 마크에 넣었을 때는 막대그래프 색상이 하나의 색상이 그라데이션으로 표현됩니다.
(그라데이션의 특징은 끊어지지 않고 이어지는 특징을 지니고 있습니다.)
두 번째 사진 속을 보면 불연속형 필드를 색상 마크에 넣었을 때는 막대그래프 색상이 각각 다르게 표현됩니다.
(빨간색 그룹, 파란색 그룹, 노란색 그룹 등등으로 각각 기준으로 분리되어 있다는 것을 알 수 있어요. )