본문 바로가기

반응형

전체 글

(291)
9장 데이터 분석 프로젝트 - 한국인의 삶을 파악하라! (2) 9-2 성별에 따른 월급 차이 - 성별에 따라 월급이 다를까? 분석 절차 1단계 - 변수 검토 및 전처리 성별 월급 2단계 - 변수 간 관계 분석 성별 월급 평균표 만들기 그래프 만들기 성별 변수 검토 및 전처리하기 1. 변수 검토하기 2. 전처리하기 welfare['sex'].dtypes # 변수 타입 출력 ##출력: dtype('float64') welfare['sex'].value_counts() # 빈도 구하기 """ 2.0 7913 1.0 6505 Name: sex, dtype: int64 """ # 이상치 확인 welfare['sex'].value_counts() """ 2.0 7913 1.0 6505 Name: sex, dtype: int64 """ # 이상치 결측 처리 welfare['se..
9장 데이터 분석 프로젝트 - 한국인의 삶을 파악하라! 9-1 '한국복지패널 데이터' 분석 준비하기 (1) '한국복지 패널 데이터'는 한국보건사회연구원에서 우리나라 가구의 경제활동을 연구해 복지 정책에 반영할 목적으로 발간하는 조사 자료 데이터 분석 준비하기 1. 데이터 준비하기 2. 패키지 설치 및 로드하기 3. 데이터 불러오기 4. 데이터 검토하기 5. 변수명 바꾸기 !pip install pyreadstat """ Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/ Collecting pyreadstat Downloading pyreadstat-1.2.1-cp39-cp39-manylinux_2_17_x86_64.manylinux2..
8장 그래프 만들기 (4) 8-5 상자 그림 - 집단 간 분포 차이 표현하기 상자 그림(box plot): 데이터의 분포 또는 퍼져 있는 형태를 직사각형 상자 모양으로 표현한 그래프 상자 그림 만들기 sns.boxplot(data = mpg, x ='drv', y ='hwy') 혼자서 해보기 - mpg 데이터를 이용해 분석 문제를 해결해 보세요 Q1 category(자동차 종류)가 'compact', 'subcompact', 'suv'인 자동차의 cty(도시 연비)가 어떻게 다른지 비교해 보려고 합니다. 세 차종의 cty를 나타낸 상자 그림을 만들어 보세요. df = mpg.query('category in ["compact", "subcompact", "suv"]') sns.boxplot(data = df, x = 'catego..

반응형