본문 바로가기

반응형

데이터 분석 학습

(45)
4장 데이터 프레임의 세계로 (1) 4-1 데이터 프레임 이해하기 - 데이터는 어떻게 생겼나? 데이터 프레임(data frame)은 데이터를 다룰 때 가장 많이 사용하는 데이터 형태로, 행과 열로 구성된 사각형 모양의 표처럼 생김 '열'은 속성-컬럼(column), 변수(variable) '행'은 정보-로(row), 케이스(case) 한 사람의 정보는 가로 한 줄에 나열 하나의 단위가 하나의 행 데이터가 크다 = 행이 많다 or 열이 많다 데이터 분석 시에는 열이 많은 것이 중요함 행이 많다 -> 컴퓨터가 느려짐 -> 고사양 장비 구축 열이 많다 -> 분석 방법의 한계 -> 고급 분석 방법 4-2 데이터 프레임 만들기-시험 성적 데이터 만들기 데이터 입력해 데이터 프레임 만들기 pandas 패키지 로드 import pandas as pd ..
3장 데이터 분석에 필요한 연장 챙기기 (2) 3-3 함수 꾸러미, '패키지' 이해하기 패키지에는 다양한 함수들이 들어있음 ex) 그래프를 만들때 사용하는 패키지 seaborn에는 scatterplot(), barplot(), lineplot() 등 수십 가지 그래프 관련 함수가 있음 스마트폰에 앱을 깔듯 입맛대로 골라 설치 가능 패키지 활용하기 패키지 로드 import seaborn 패키지 함수 사용 var = ['a', 'a', 'b', 'c'] var ##출력: ['a', 'a', 'b', 'c'] seaborn.countplot(x = var) 패키지 약어 활용하기 import seaborn as sns sns.countplot(x = var) seaborn의 titanic 데이터로 그래프 만들기 seaborn의 load_dataset()으로..
3장 데이터 분석에 필요한 연장 챙기기 (1) 3-1 변하는 수, '변수' 이해하기 변수(variable)는 변하는 수 데이터는 변수의 덩어리 변수는 데이터 분석의 대상 데이터 분석은 변수 간에 어떤 관계가 있는지 파악하는 작업 상수(constant)는 분석할 것이 없다 변수 만들기 a = 1 a ## 출력: 1 b = 2 b ##출력: 2 c = 3 c ##출력: 3 d = 3.5 d ##출력: 3.5 a + b ##출력: 3 a + b + c ##출력: 6 4 / b ##출력: 2.0 5 * b ##출력: 10 변수명은 알아보기 쉽고 잘 기억되도록 의미를 담아 정함 변수명은 문자, 숫자, 언더바(_)를 조합해서 만듬 반드시 문자로 시작해야 함 대소문자를 구분 여러 값으로 구성된 변수 만들기 var1 = [1,2,3] var1 ##출력: [1, 2..
2장 파이썬 데이터 분석 환경 만들기 2-1 아나콘다로 파이썬과 JupyterLab 설치하기 아나콘다 다운로드 및 설치 - 아나콘다 다운로드 페이지 접속 (anacoda.com/products/distribution) - Anaconda Installers 항목을 찾아 운영 체제에 맞는 링크 클릭해 설치 파일 다운로드 - 설치 파일 실행해서 설치 - Anaconda Navigator 실행 프롬프트에서 파이썬 사용해보기 - Anacoda Prompt 실행 - 명령어 입력 칸에 python 입력 후 실행 2-2 JupyterLab과 친해지기 JupyterLab 실행하기 - 아나콘다 프롬프트 실행 - jupyter lab 입력하고 실행 노트북 다루기 셀을 이용해 명령어 실행 에디트 모드와 커맨드 모드 에디트 모드 : 셀에 코드를 입력하거나 수정할..
1장 안녕, 파이썬? 1-1 데이터 분석과 파이썬 데이터 분석 분야에서 파이썬은 인기 있음 사용하는 곳 통계 분석 머신러닝 모델링 텍스트 마이닝 네트워크 분석 지도 시각화 주식 분석 이미지 분석 사운드 분석 소프트웨어 개발 1-2 파이썬이 강력한 데이터 분석 도구인 이유 무료로 사용 가능 데이터 분석을 대중화함 오픈 소스 생태계가 발달 됨 패키지 공유 소프트웨어 저장소 PyPI (https://pypi.org/) 깃허브, 콘다 교육 재료가 다양함 다양한 그래프를 만들 수 있음 전문적인 데이터 분석까지 가능한 프로그래밍 방식 재현성 확보 오류가 줄어듬 공동 작업 가능 ※ 해당 내용은 의 내용을 토대로 학습하며 정리한 내용입니다.

반응형