본문 바로가기

반응형

전체 글

(291)
4장 데이터 프레임의 세계로 (1) 4-1 데이터 프레임 이해하기 - 데이터는 어떻게 생겼나? 데이터 프레임(data frame)은 데이터를 다룰 때 가장 많이 사용하는 데이터 형태로, 행과 열로 구성된 사각형 모양의 표처럼 생김 '열'은 속성-컬럼(column), 변수(variable) '행'은 정보-로(row), 케이스(case) 한 사람의 정보는 가로 한 줄에 나열 하나의 단위가 하나의 행 데이터가 크다 = 행이 많다 or 열이 많다 데이터 분석 시에는 열이 많은 것이 중요함 행이 많다 -> 컴퓨터가 느려짐 -> 고사양 장비 구축 열이 많다 -> 분석 방법의 한계 -> 고급 분석 방법 4-2 데이터 프레임 만들기-시험 성적 데이터 만들기 데이터 입력해 데이터 프레임 만들기 pandas 패키지 로드 import pandas as pd ..
3장 데이터 분석에 필요한 연장 챙기기 (2) 3-3 함수 꾸러미, '패키지' 이해하기 패키지에는 다양한 함수들이 들어있음 ex) 그래프를 만들때 사용하는 패키지 seaborn에는 scatterplot(), barplot(), lineplot() 등 수십 가지 그래프 관련 함수가 있음 스마트폰에 앱을 깔듯 입맛대로 골라 설치 가능 패키지 활용하기 패키지 로드 import seaborn 패키지 함수 사용 var = ['a', 'a', 'b', 'c'] var ##출력: ['a', 'a', 'b', 'c'] seaborn.countplot(x = var) 패키지 약어 활용하기 import seaborn as sns sns.countplot(x = var) seaborn의 titanic 데이터로 그래프 만들기 seaborn의 load_dataset()으로..
3장 데이터 분석에 필요한 연장 챙기기 (1) 3-1 변하는 수, '변수' 이해하기 변수(variable)는 변하는 수 데이터는 변수의 덩어리 변수는 데이터 분석의 대상 데이터 분석은 변수 간에 어떤 관계가 있는지 파악하는 작업 상수(constant)는 분석할 것이 없다 변수 만들기 a = 1 a ## 출력: 1 b = 2 b ##출력: 2 c = 3 c ##출력: 3 d = 3.5 d ##출력: 3.5 a + b ##출력: 3 a + b + c ##출력: 6 4 / b ##출력: 2.0 5 * b ##출력: 10 변수명은 알아보기 쉽고 잘 기억되도록 의미를 담아 정함 변수명은 문자, 숫자, 언더바(_)를 조합해서 만듬 반드시 문자로 시작해야 함 대소문자를 구분 여러 값으로 구성된 변수 만들기 var1 = [1,2,3] var1 ##출력: [1, 2..

반응형