반응형
8-5 상자 그림 - 집단 간 분포 차이 표현하기
상자 그림(box plot): 데이터의 분포 또는 퍼져 있는 형태를 직사각형 상자 모양으로 표현한 그래프
상자 그림 만들기
sns.boxplot(data = mpg, x ='drv', y ='hwy')
혼자서 해보기 - mpg 데이터를 이용해 분석 문제를 해결해 보세요
Q1 category(자동차 종류)가 'compact', 'subcompact', 'suv'인 자동차의 cty(도시 연비)가 어떻게 다른지 비교해 보려고 합니다. 세 차종의 cty를 나타낸 상자 그림을 만들어 보세요.
df = mpg.query('category in ["compact", "subcompact", "suv"]')
sns.boxplot(data = df, x = 'category', y = 'cty')
정리
### 1. 산점도
sns.scatterplot(data = mpg, x = 'displ', y = 'hwy')
# 축 제한
sns.scatterplot(data = mpg, x = 'displ', y = 'hwy') \
.set(xlim = [3, 6], ylim = [10, 30])
# 종류별로 표식 색깔 바꾸기
sns.scatterplot(data = mpg, x = 'displ', y = 'hwy', hue = 'drv')
### 2. 막대 그래프
## 평균 막대 그래프
# 1단계. 평균표 만들기
df_mpg = mpg.groupby('drv', as_index = False) \
.agg(mean_hwy = ('hwy', 'mean'))
# 2단계. 그래프 만들기
sns.barplot(data = df_mpg, x = 'drv', y = 'mean_hwy')
## 빈도 막대 그래프
sns.countplot(data = mpg, x = 'drv')
### 3. 선 그래프
sns.lineplot(data = economics, x = 'date', y = 'unemploy')
### 4. 상자 그림
sns.boxplot(data = mpg, x = 'drv', y = 'hwy')
※ 해당 내용은 <Do it! 파이썬 데이터 분석>의 내용을 토대로 학습하며 정리한 내용입니다.
반응형
'데이터 분석 학습' 카테고리의 다른 글
9장 데이터 분석 프로젝트 - 한국인의 삶을 파악하라! (2) (0) | 2023.04.22 |
---|---|
9장 데이터 분석 프로젝트 - 한국인의 삶을 파악하라! (0) | 2023.04.21 |
8장 그래프 만들기 (3) (0) | 2023.04.19 |
8장 그래프 만들기 (2) (0) | 2023.04.18 |
8장 그래프 만들기 (1) (0) | 2023.04.17 |