데이터분석/Tableau

[Tableau] 상관 관계와 분포를 나타내는 차트

환성 2023. 2. 13. 17:17
728x90

스캐터 플랏(Scatter plot)

  • 산점도, 산포도라고 불리며 점들이 여기저기 흩어진 모양의 그래프이다.
  • x축과 y축에 해당하는 데이터의 상관관계를 표현할 때 사용하며 두 개의 축 기준으로 데이터가 얼마나 퍼져있는지를 알 수 있다.

고객의 Profit과 Discount의 상관관계

 

  • 눈에 잘 들어오는 스캐터 플랏 만들기
    • 색상 불투명도 줄이기
    • 테두리를 짙은 색상으로 주기
    • 양 극단의 값을 제외함으로써 보다 화면이 줌인됨으로써 디테일 수준을 높일 수 있다.
    • 추세선을 통해 두 개의 측정값간의 상관관계를 볼 수 있다.

불투명도를 줄이고 테두리를 짙은 색상을 줌으로써 보다 눈에 잘 들어오게 된다
양 극단 값 제거

 

추세선 : Profit =  - 835.632 * 평균 Discount + 270.83

 

 

 

단위가 설정된 구간의 크기를 자유롭게 조정할 때 

  • Profit(bin) 필드 우클릭 -> 편집 -> 구간차원 크기
  • 구간차원의 크기를 조정함으로써 그래프가 다르게 보일 수 있다.

Profit에 대한 Orders의 갯수 그래프

 

 

 

좀더 그래프가 촘촘하게 바뀐다

 

박스 플랏(Box plot)

  • 상자 수염 그림(Box-and-Whisker Plot)이라고도 불리며 데이터 집합의 범위와 중앙값을 빠르게 확인할 수 있는 목적으로 사용된다.
  • 최솟값, 제 1사분위(Q1, 25%), 제 2사분위(Q2, 중앙값), 제 3사분위(Q3, 75%), 최댓값, 이상치으로 이루어져 있다.

박스 플랏 설명도

 

  • 박스 플랏의 예시
    • 짙은 회색 박스의 아래쪽 경계선의 점 : 1~17번 중 1/4 위치
    • IQR(Interquartile Range) : Q3 - Q1(회색 박스의 전체 범위)
    • Q3 + IQR * 1.5보다 크거나  Q1 - IQR * 1.5보다 작으면 이상치(Outlier)로 판단
    • 기초 마크 숨기기를 통해 분포만 볼 수 있다.

Sub-category에 대한 합계(Profit)의 박스 플랏

 

 

 

 

출처 : 

https://leebaro.tistory.com/entry/%EB%B0%95%EC%8A%A4-%ED%94%8C%EB%A1%AFbox-plot-%EC%84%A4%EB%AA%85