시계열, 순위, 부분-전체, 명목 비교 수행
학습 목표
이 유닛을 완료하면 다음을 수행할 수 있습니다.
- 시계열, 순위, 부분-전체 및 명목 비교를 알아봅니다.
- 이러한 비교에 사용할 수 있는 최적의 차트 유형과 방법을 이해합니다.
명목 비교
‘명목’이라는 단어는 이름을 뜻하는 라틴어에서 유래한 것입니다. 명목 비교란 범주 비교를 의미합니다. 명목 비교에 적합한 특성은 2D 위치, 색상 색조 및 도형입니다.
막대형 차트
이전 유닛에서는 막대형 차트의 길이가 정량적 값을 구분하는 데 효과적이라는 내용을 배웠습니다. 막대형 차트로 여러 범주를 비교할 때는 막대의 2D 위치 및 길이 특성을 사용하여 범주를 비교할 수 있습니다. 개별 막대 사이의 뚜렷한 간격과 막대의 순서는 막대의 길이로 표현되는 정량적 값을 여러 범주에서 비교하는 데 도움이 됩니다. 서수형 변수에 대한 순위 또는 순서를 지정하면 데이터의 중요한 패턴을 보여줄 수 있습니다.
범주 인코딩
범주를 비교할 때 색상(또는 색조) 및 도형 특성을 사용하여 범주를 구분할 수 있습니다.
위의 첫 번째 이미지에서 시계열 선 차트는 색상을 사용하여 여러 도시를 구분합니다. 두 번째 이미지에서 산점도는 도형으로 제품 범주를 구분합니다.
시계열
시계열 차트는 시간 간격을 통해 정량적 값을 비교합니다. 선 차트를 사용하면 시간에 따른 패턴과 추세를 확인할 수 있습니다.
선 차트
선 차트는 시계열을 표시하는 데 가장 일반적으로 사용되는 차트이며 시간에 따른 패턴과 추세를 볼 수 있는 최적의 방법이기도 합니다. 예를 들어, 이 선 차트에서는 시간에 따른 수익을 쉽게 확인할 수 있습니다.
그래프의 각 데이터 포인트를 연결하는 선 차트 외에도 시계열 그래프에 추세선을 추가할 수 있습니다. 추세선을 사용하면 측정값의 전반적인 추세와 방향을 확인하고 적절한 지침 및 결정을 내릴 수 있습니다. 아래 선 그래프의 추세선은 시간에 따라 수익이 증가하는 패턴을 보여줍니다.
세로 막대형 차트
세로 막대는 전반적인 추세 대신 개별 값을 표시하는 것이 중요한 시계열 비교에 유용합니다. 다음 세로 막대형 차트에서는 전반적인 추세보다 2분기의 낮은 값에 초점을 둡니다.
상자 플롯
상자 플롯은 중앙값(상자 중앙의 선), 25번째 및 75번째 백분위수(상자의 끝부분), 개별 데이터 포인트를 표시하여 분포를 나타냅니다. 여러 개의 상자 플롯을 사용하여 시간에 따른 분포를 비교할 수 있습니다.
순위
순위 비교를 표시하는 차트는 여러 범주 간의 값을 정렬(내림차순 또는 오름차순)합니다. 순위 비교를 표시하는 방법에는 여러 가지가 있습니다.
막대형 차트
순위 비교에 가장 일반적으로 사용되는 차트는 막대형 차트입니다. 막대형 차트에서는 값의 특수성을 강조할 수 있습니다. 또한 막대를 오름차순 또는 내림차순으로 정렬하면 값의 순위를 매길 수 있습니다. 다음 예에서는 의자의 하위 범주가 가장 높은 값을 보이며, 테이블과 바인더의 차이가 작은 가운데 테이블이 바인더보다 순위가 높은 것을 확인할 수 있습니다.
순위 비교를 표시하는 기타 차트
막대형 차트를 올바르게 해석하려면 기준이 항상 0이어야 합니다. 기준을 0으로 설정할 수 없는 경우에는 점도를 사용할 수 있습니다. 막대 대신 끝점이 점으로 대체됩니다. 쌍을 이루는 값을 볼 때는 점을 연결하여 값 쌍 간의 차이를 하이라이트할 수 있습니다.
이 블로그 게시물에서는 Lisa Charlotte Muth가 연령 중앙값별 국가 순위를 점도로 표시하는 방법을 설명합니다. 점도에서는 축이 0에서 시작할 필요가 없습니다.
시간에 따라 순위가 바뀌는 상황에서 범프 차트는 각 범주의 선이 시간에 따른 순위를 따라가도록 하는 방식으로 순위를 표시합니다. 여기에 표시된 Tableau Public의 Matt Chambers가 작성한 범프 차트에서, '기타 색상' 범주는 2000년에 3위에서 시작하며 2005년을 거쳐 2015년에 10위에 오를 때까지 시간에 따라 순위가 바뀝니다.
부분-전체
부분-전체 비교 차트에서는 값이 전체에 대한 비율로 표시됩니다(대부분 백분율).
누적 막대형 차트
부분-전체 관계를 표시하는 가장 일반적인 차트는 막대형 차트입니다. 누적 막대형 차트는 각 막대를 하위 구성 요소별로 분할합니다. 각 부분은 백분율, 수 또는 특정 측정값으로 표시할 수 있습니다. 다음 예에서는 세 개의 누적 막대형 차트로 배송 모드별 매출을 표시하고 각 세그먼트를 비교합니다.
첫 번째 차트의 Y축은 매출을 나타냅니다. 두 번째 차트의 Y축은 총합계의 백분율을 나타냅니다. 세 번째 차트의 Y축은 각 세그먼트의 백분율을 표시합니다. 개별 레이블을 통해 백분율이 나타내는 매출 값을 컨텍스트와 함께 볼 수 있습니다. 백분율을 표시할 때는 컨텍스트를 제공하고 백분율이 나타내는 수나 측정값을 공유하는 것이 중요합니다.
원형 차트
대부분의 데이터 시각화 실무자는 ‘위대한 파이 논쟁’(great pie debate)을 경험한 적이 있을 것입니다. 두 번째 유닛에서는 길이 특성을 사용하면 크기 차이보다 값 차이를 훨씬 쉽게 인식할 수 있다는 내용을 배웠습니다. 원형 차트에서 크기 특성을 사용할 때는 사소한 차이를 확인하기 어려울 수 있습니다. 다음 예에서 원형 차트로는 작은 부분들을 구분하기 어렵지만 막대 차트를 사용하면 사소한 차이도 매우 쉽게 구분할 수 있습니다.
가끔 원형 차트가 더 효과적인 경우도 있습니다. 섹션 수가 매우 적고 작은 차이를 구분할 필요가 없는 경우 원형 차트가 효과적일 수 있습니다. 전체의 정확히 절반(50%)을 차지하는 범주를 표시하는 경우 원형 차트가 더 읽기 쉽습니다.
영역 선 차트
영역 선 차트를 사용하면 시간에 따른 변화와 부분-전체에 대한 질문의 답을 찾을 수 있습니다. 시간에 따른 부분-전체를 표시할 때는 색상과 영역 크기를 사용하여 시계열 선 차트로 부분-전체를 표시할 수 있습니다. 다음 예에서는 표준 등급 배송 모드가 항상 가장 많이 사용되는 유형임을 알 수 있습니다.
트리 맵
대규모 계층적 데이터 집합의 경우 트리 맵을 사용하면 하나의 그래프에 중첩된 범주를 표시할 수 있습니다. 다음 예에서는 각 배송 모드에 대한 하위 범주의 매출 비율을 부분-전체로 보여줍니다. 트리 맵은 크기 특성을 사용하여 차이를 표시하므로 보면서 비교하는 데 어려움을 겪을 수 있습니다. 개별 하위 범주를 비교하는 것이 중요한 경우에는 소규모의 여러 막대형 차트가 대안이 될 수 있습니다. 자세한 내용은 트리맵을 사용하여 데이터 시각화하기를 참조하세요.
리소스
- Tableau 블로그: 상자 수염 그림
- Storytelling with Data 블로그: What is a dot plot?(점도의 정의)
- Trailhead: 착오를 일으키는 차트를 인식하기 위한 지침
- Tableau: 착오를 일으키는 차트 식별하기 - 체크리스트
- Tableau: 원형 차트
- Tableau: 데이터 대화: 원형 차트냐, 아니냐?
- Trailhead: 데이터 분포
- Datawrapper 블로그 포스트: I’m surrounded by old people(점점 더 높아지는 연령층)
- Tableau Public: 2000-2015년 북미 지역의 신차 색상 인기도
- Data Plus Science 블로그: Using Treemaps to Visualize Data(트리 맵을 사용한 데이터 시각화)