본문 바로가기

데이터 분석 학습

9장 데이터 분석 프로젝트 - 한국인의 삶을 파악하라! (4)

반응형

9-4 연령대에 따른 월급 차이 - 어떤 연령대의 월급이 가장 많을까?

분석 절차

1단계 변수 검토 및 전처리

  • 연령대
  • 월급

2단계 변수 간 관계 분석

  • 연령대별 월급 평균표 만들기
  • 그래프 만들기
# 나이 변수 살펴보기
welfare['age'].head()

"""
0    75.0
1    72.0
2    78.0
3    58.0
4    57.0
Name: age, dtype: float64
"""
# 연령대 변수 만들기
welfare = welfare.assign(ageg = np.where(welfare['age'] <  30, 'young',
                                np.where(welfare['age'] <= 59, 'middle', 'old')))

# 빈도 구하기
welfare['ageg'].value_counts()

"""
old       5955
middle    4963
young     3500
Name: ageg, dtype: int64
"""
# 빈도 막대 그래프 만들기
sns.countplot(data = welfare, x = 'ageg')

# 막대 정렬하기
sns.barplot(data = ageg_income, x = 'ageg', y = 'mean_income',
            order = ['young', 'middle', 'old'])

 

 

 

 

 

※ 해당 내용은 <Do it! 파이썬 데이터 분석>의 내용을 토대로 학습하며 정리한 내용입니다.

반응형