본문 바로가기

반응형

전체 글

(291)
6장 자유자재로 데이터 가공하기 (5) 6-6 집단별로 요약하기 '집단별 평균'이나 '집단별 빈도'처럼 각 집단을 요약한 값을 구할 때는 df.groupby(), df.agg()를 사용 집단별로 요약하기 전체 요약 통계량 구하기 exam.agg(mean_math = ('math', 'mean')) 집단별 요약 통계량 구하기 exam.groupby('nclass').agg(mean_math = ('math', 'mean')) ※ 변수를 인덱스로 바꾸지 않기 exam.groupby('nclass', as_index = False).agg(mean_math = ('math', 'mean')) agg()에 자주 사용하는 요약 통계량 함수 ※ 모든 변수의 요약 통계량 한 번에 구하기 exam.groupby('nclass').mean() mpg.quer..
6장 자유자재로 데이터 가공하기 (4) 6-4 순서대로 정렬하기 df.sort_values() 이용 오름차순으로 정렬하기 exam.sort_values('math') 내림차순으로 정렬하기 exam.sort_values('math', ascending = False) 여러 정렬 기준 적용하기 exam.sort_values(['nclass', 'math']) exam.sort_values(['nclass', 'math'], ascending = [True, False]) 혼자서 해보기 - mpg 데이터를 이용해 분석 문제를 해결해 보세요 Q1 'audi'에서 생산한 자동차 중에 어떤 자동차 모델의 hwy(고속도로 연비)가 높은지 알아보려고 합니다. 'audi'에서 생산한 자동차 중 hwy가 1~5위에 해당하는 자동차의 데이터를 출력하세요 mpg...
6장 자유자재로 데이터 가공하기 (3) 6-3 필요한 변수만 추출하기 변수 추출하기 데이터 프레임명 뒤에 []를 입력한 다음 추출한 변수명을 따옴표로 감싸서 입력 exam['math'] """ 0 50 1 60 2 45 3 30 4 25 5 50 6 80 7 90 8 20 9 50 10 65 11 45 12 46 13 48 14 75 15 58 16 65 17 80 18 89 19 78 Name: math, dtype: int64 """ exam['english'] """ 0 98 1 97 2 86 3 98 4 80 5 89 6 90 7 78 8 98 9 98 10 65 11 85 12 98 13 87 14 56 15 98 16 68 17 78 18 68 19 83 Name: english, dtype: int64 """ exam[['ncla..

반응형