6장 자유자재로 데이터 가공하기 (3)

6-3 필요한 변수만 추출하기

변수 추출하기

데이터 프레임명 뒤에 []를 입력한 다음 추출한 변수명을 따옴표로 감싸서 입력

exam['math']

"""
0     50
1     60
2     45
3     30
4     25
5     50
6     80
7     90
8     20
9     50
10    65
11    45
12    46
13    48
14    75
15    58
16    65
17    80
18    89
19    78
Name: math, dtype: int64
"""

exam['english']

"""
0     98
1     97
2     86
3     98
4     80
5     89
6     90
7     78
8     98
9     98
10    65
11    85
12    98
13    87
14    56
15    98
16    68
17    78
18    68
19    83
Name: english, dtype: int64
"""

exam[['nclass', 'math', 'english']]

변수 제거하기

df.drop()을 이용

exam.drop(columns = 'math')

exam.drop(columns = ['math', 'english'])

pandas 함수 조합하기

query()와 []조합하기

exam.query('nclass == 1')['english']

"""
0    98
1    97
2    86
3    98
Name: english, dtype: int64
"""

exam.query('math >= 50')[['id', 'math']]

일부만 출력하기

exam.query('math >= 50')[['id', 'math']].head()

exam.query('math >= 50')[['id', 'math']].head(10)

가독성 있게 코드 줄 바꾸기

exam.query('math >= 50')\
      [['id', 'math']]\
      .head(10)

혼자서 해보기 - mpg 데이터를 이용해 분석 문제를 해결해 보세요

Q1 mpg 데이터는 11개 변수로 구성됩니다. 이 중 일부만 추출해 분석에 활용하려고 합니다. mpg 데이터에서 category(자동차 종류), cty(도시 연비) 변수를 추출해 새로운 데이터를 만드세요. 새로 만든 데이터의 일부를 출력해 두 변수로만 구성되어 있는지 확인하세요.

mpg = pd.read_csv('mpg.csv')
mpg_p = mpg[['category', 'cty']]
mpg_p.head()

Q2 자동차 종류에 따라 도시 연비가 어떻게 다른지 알아보려고 합니다. 앞에서 추출한 데이터를 이용해 category(자동차 종류)가 'suv'인 자동차와 'compact'인 자동차 중 어떤 자동차의 cty(도시 연비) 평균이 더 높은지 알아보세요.

mpg_p.query('category == "suv"')['cty'].mean()
##출력: 13.5

mpg_p.query('category == "compact"')['cty'].mean()
##출력: 20.127659574468087

※ 해당 내용은 <Do it! 파이썬 데이터 분석>의 내용을 토대로 학습하며 정리한 내용입니다.

저작자표시 동일조건 (새창열림)

'데이터 분석 학습' 카테고리의 다른 글

6장 자유자재로 데이터 가공하기 (5) (0)	2023.04.11
6장 자유자재로 데이터 가공하기 (4) (0)	2023.04.10
6장 자유자재로 데이터 가공하기 (2) (0)	2023.04.08
6장 자유자재로 데이터 가공하기 (1) (0)	2023.04.07
5장 데이터 분석 기초! - 데이터 파악하기, 다루기 쉽게 수정하기 (3) (0)	2023.04.06

IT & technology

6장 자유자재로 데이터 가공하기 (3)

6-3 필요한 변수만 추출하기

변수 추출하기

변수 제거하기

pandas 함수 조합하기

가독성 있게 코드 줄 바꾸기

혼자서 해보기 - mpg 데이터를 이용해 분석 문제를 해결해 보세요

'데이터 분석 학습' 카테고리의 다른 글

티스토리툴바

6장 자유자재로 데이터 가공하기 (3)

6-3 필요한 변수만 추출하기

변수 추출하기

변수 제거하기

pandas 함수 조합하기

가독성 있게 코드 줄 바꾸기

혼자서 해보기 - mpg 데이터를 이용해 분석 문제를 해결해 보세요

'데이터 분석 학습' 카테고리의 다른 글

'데이터 분석 학습' Related Articles

티스토리툴바