[Python.Seaborn] Seaborn 필수 그래프 정리 2 - Count Plot, Bar Plot, Dist Plot

2021. 1. 19. 05:00Python과 머신러닝/MatPlotLib 데이터 시각화

0. 이전 포스트

 

1. Count Plot 그리기 - 기본

In [10]:import numpy as np 
        import pandas as pd
        import matplotlib.pyplot as plt
        import seaborn as sns
        sns.countplot(x='smoker', data=tips)
Out[10]:

Out[10]

  • 지난 포스트에 이어서 Count Plot을 그려보자.
  • y는 항상 count이기 때문에 따로 지정하지 않고 x만 지정하면 구분이 된다.
  • 흡연자와 비흡연자의 분포를 count plot을 통해서 볼 수 있다.

 

2. Count Plot 그리기 - hue별 구분

In [11]:sns.countplot(x='smoker', hue='time', data=tips)
Out[11]:

Out[11]

  • y는 지정할 수 없지만 hue는 동일하게 지정이 가능하다.
  • 점심/저녁 모두 비흡연자가 흡연자보다 많지만, 눈으로 봤을 때는 점심에 비흡연자의 비율이 더 적은 것 같다.
  • 역시 흡연자들의 점심시간이 소중한 것은 해외도 마찬가지인가?라는 짧은 해석을 해보고 넘어간다.

 

3. Bar Plot 그리기

In [12]:sns.barplot(x='day', y='tip', data=tips)
Out[12]:

Out[12]

  • y를 Count가 아닌 Tip 값을 보고 싶다면 bar plot을 통해 볼 수 있다.
  • x를 day(요일)로 지정하니 주말에 팁이 평균적으로 더 많다는 것을 확인할 수 있다.
  • 주말에 기분이 좋아서 팁을 많이 주는 것일 수도 있지만, 주말에 더 많은 손님이 있어서 매출이 기본적으로 더 높아서 서빙하는 사람이 받는 팁이 더 많을 수도 있을 것 같다.
  • 데이터는 데이터일 뿐 해석은 본인의 통찰의 수준에 따라 달라진다.

 

4. Dist Plot 그리기

In [13]:sns.displot(tips['total_bill'], bins=5) 
Out[13]:

Out[13]

  • 데이터와 몇 개의 bin으로 Dist Plot을 나눠서 표현할지를 선택하면 Out[13]과 같은 결과가 나온다.
  • 총 비용의 분포를 5개의 칸으로 나눠서 보면, 대부분이 2번째 bin에 있다는 것을 볼 수 있다.

 

5. 관련 포스트