본문 바로가기

반응형

전체 글

(291)
6장 자유자재로 데이터 가공하기 (2) 6-2 조건에 맞는 데이터만 추출하기 여러 조건 중 하나 이상 충족하는 행 추출 # 수학 점수가 90점 이상이거나 영어 점수가 90점 이상인 경우 exam.query('math >= 90 or english >= 90') #영어 점수가 90점 미만이거나 과학 점수가 50점 미만인 경우 exam.query('english < 90 | science < 50') 목록에 해당하는 행 추출하기 # 1,3,5반에 해당하면 추출 exam.query('nclass == 1 or nclass == 3 or nclass == 5') exam.query('nclass in [1,3,5]') 추출한 행으로 데이터 만들기 # nclass가 1인 행 추출해 nclass1에 할당 nclass1 = exam.query('nclas..
6장 자유자재로 데이터 가공하기 (1) 6-1 데이터 전처리-원하는 형태로 데이터 가공하기 데이터 전처리 (data preprocessing) : 분석에 적합하게 데이터를 가공하는 작업 일부를 추출하거나, 종류별로 나누거나, 여러 데이터를 합치는 등 데이터를 자유롭게 가공할 수 있어야 목적에 맞게 사용 가능 데이터 가공, 데이터 핸들링, 데이터 랭글링, 데이터 먼징이 비슷한 의미로 사용 pandas를 이용해 데이터를 가공하는 방법 6-2 조건에 맞는 데이터만 추출하기 pandas의 df.query()를 사용하면 원하는 데이터를 추출 가능 조건에 맞는 데이터만 추출하기 import pandas as pd exam = pd.read_csv('exam.csv') exam #exam에서 nclass가 1인 경우만 exam.query('nclass =..
5장 데이터 분석 기초! - 데이터 파악하기, 다루기 쉽게 수정하기 (3) 정리하기 # 1. 패키지 로드 import pandas as pd import numpy as np # 2. 데이터 불러오기 mpg = pd.read_csv('mpg.csv') # 3. 데이터 파악하기 mpg.head() # 데이터 앞부분 mpg.tail() # 데이터 뒷부분 mpg.shape # 행, 열 수 mpg.info() # 속성 mpg.describe() # 요약 통계량 # 4. 변수명 바꾸기 mpg = mpg.rename(columns = {'manufacturer' : 'company'}) # 5. 파생변수 만들기 mpg['total'] = (mpg['cty'] + mpg['hwy'])/2 # 변수 조합 mpg['test'] = np.where(mpg['total'] >= 20, 'pass'..

반응형