반응형
9-4 연령대에 따른 월급 차이 - 어떤 연령대의 월급이 가장 많을까?
분석 절차
1단계 변수 검토 및 전처리
- 연령대
- 월급
2단계 변수 간 관계 분석
- 연령대별 월급 평균표 만들기
- 그래프 만들기
# 나이 변수 살펴보기
welfare['age'].head()
"""
0 75.0
1 72.0
2 78.0
3 58.0
4 57.0
Name: age, dtype: float64
"""
# 연령대 변수 만들기
welfare = welfare.assign(ageg = np.where(welfare['age'] < 30, 'young',
np.where(welfare['age'] <= 59, 'middle', 'old')))
# 빈도 구하기
welfare['ageg'].value_counts()
"""
old 5955
middle 4963
young 3500
Name: ageg, dtype: int64
"""
# 빈도 막대 그래프 만들기
sns.countplot(data = welfare, x = 'ageg')
# 막대 정렬하기
sns.barplot(data = ageg_income, x = 'ageg', y = 'mean_income',
order = ['young', 'middle', 'old'])
※ 해당 내용은 <Do it! 파이썬 데이터 분석>의 내용을 토대로 학습하며 정리한 내용입니다.
반응형
'데이터 분석 학습' 카테고리의 다른 글
9장 데이터 분석 프로젝트 - 한국인의 삶을 파악하라! (6) (0) | 2023.04.26 |
---|---|
9장 데이터 분석 프로젝트 - 한국인의 삶을 파악하라! (5) (0) | 2023.04.25 |
9장 데이터 분석 프로젝트 - 한국인의 삶을 파악하라! (3) (0) | 2023.04.23 |
9장 데이터 분석 프로젝트 - 한국인의 삶을 파악하라! (2) (0) | 2023.04.22 |
9장 데이터 분석 프로젝트 - 한국인의 삶을 파악하라! (0) | 2023.04.21 |