본문 바로가기

반응형

전체 글

(291)
9장 데이터 분석 프로젝트 - 한국인의 삶을 파악하라! (8) 9-8 종교 유무에 따른 이혼율 - 종교가 있으면 이혼을 덜 할까? 분석 절차 1단계 변수 검토 및 전처리 종교 혼인 상태 2단계 변수 간 관계 분석 종교 유무에 따른 이혼율 표 만들기 그래프 만들기 종교 변수 검토 및 전처리하기 1. 변수 검토하기 2. 전처리 welfare['religion'].dtypes # 변수 타입 출력 ##출력: dtype('float64') welfare['religion'].value_counts() # 빈도 구하기 """ 2.0 7815 1.0 6603 Name: religion, dtype: int64 """ # 종교 유무 이름 부여 welfare['religion'] = np.where(welfare['religion'] == 1, 'yes', 'no') # 빈도 구하..
9장 데이터 분석 프로젝트 - 한국인의 삶을 파악하라! (7) 9-7 성별 직업 빈도 - 성별로 어떤 직업이 가장 많을까? 분석 절차 1단계 변수 검토 및 전처리 성별 직업 2. 변수 간 관계 분석 성별 직업 빈도표 만들기 그래프 만들기 성별 직업 빈도 분석하기 1. 성별 직업 빈도표 만들기 2. 그래프 만들기 ## 남성 직업 빈도 상위 10개 추출 # job 결측치 제거 # male 추출 # job별 분리 # job 빈도 구하기 # 내림차순 정렬 # 상위 10행 추출 job_male = welfare.dropna(subset = ['job']) \ .query('sex == "male"') \ .groupby('job', as_index = False) \ .agg(n = ('job', 'count')) \ .sort_values('n', ascending = F..
9장 데이터 분석 프로젝트 - 한국인의 삶을 파악하라! (6) 9-6 직업별 월급 차이 - 어떤 직업이 월급을 가장 많이 받을까? 분석 절차 1단계 변수 검토 및 전처리 직업 월급 2단계 변수 간 관계 분석 직업별 월급 평균표 만들기 그래프 만들기 직업 변수 검토 및 전처리하기 1. 변수 검토하기 2. 전처리하기 welfare['code_job'].dtypes # 변수 타입 출력 ##출력: dtype('float64') welfare['code_job'].value_counts() # 빈도 구하기 """ 611.0 962 941.0 391 521.0 354 312.0 275 873.0 236 ... 112.0 2 784.0 2 423.0 1 861.0 1 872.0 1 Name: code_job, Length: 150, dtype: int64 """ list_job..

반응형