데이터 분석 (46) 썸네일형 리스트형 4장 데이터 프레임의 세계로 (1) 4-1 데이터 프레임 이해하기 - 데이터는 어떻게 생겼나? 데이터 프레임(data frame)은 데이터를 다룰 때 가장 많이 사용하는 데이터 형태로, 행과 열로 구성된 사각형 모양의 표처럼 생김 '열'은 속성-컬럼(column), 변수(variable) '행'은 정보-로(row), 케이스(case) 한 사람의 정보는 가로 한 줄에 나열 하나의 단위가 하나의 행 데이터가 크다 = 행이 많다 or 열이 많다 데이터 분석 시에는 열이 많은 것이 중요함 행이 많다 -> 컴퓨터가 느려짐 -> 고사양 장비 구축 열이 많다 -> 분석 방법의 한계 -> 고급 분석 방법 4-2 데이터 프레임 만들기-시험 성적 데이터 만들기 데이터 입력해 데이터 프레임 만들기 pandas 패키지 로드 import pandas as pd .. 3장 데이터 분석에 필요한 연장 챙기기 (2) 3-3 함수 꾸러미, '패키지' 이해하기 패키지에는 다양한 함수들이 들어있음 ex) 그래프를 만들때 사용하는 패키지 seaborn에는 scatterplot(), barplot(), lineplot() 등 수십 가지 그래프 관련 함수가 있음 스마트폰에 앱을 깔듯 입맛대로 골라 설치 가능 패키지 활용하기 패키지 로드 import seaborn 패키지 함수 사용 var = ['a', 'a', 'b', 'c'] var ##출력: ['a', 'a', 'b', 'c'] seaborn.countplot(x = var) 패키지 약어 활용하기 import seaborn as sns sns.countplot(x = var) seaborn의 titanic 데이터로 그래프 만들기 seaborn의 load_dataset()으로.. 3장 데이터 분석에 필요한 연장 챙기기 (1) 3-1 변하는 수, '변수' 이해하기 변수(variable)는 변하는 수 데이터는 변수의 덩어리 변수는 데이터 분석의 대상 데이터 분석은 변수 간에 어떤 관계가 있는지 파악하는 작업 상수(constant)는 분석할 것이 없다 변수 만들기 a = 1 a ## 출력: 1 b = 2 b ##출력: 2 c = 3 c ##출력: 3 d = 3.5 d ##출력: 3.5 a + b ##출력: 3 a + b + c ##출력: 6 4 / b ##출력: 2.0 5 * b ##출력: 10 변수명은 알아보기 쉽고 잘 기억되도록 의미를 담아 정함 변수명은 문자, 숫자, 언더바(_)를 조합해서 만듬 반드시 문자로 시작해야 함 대소문자를 구분 여러 값으로 구성된 변수 만들기 var1 = [1,2,3] var1 ##출력: [1, 2.. 2장 파이썬 데이터 분석 환경 만들기 2-1 아나콘다로 파이썬과 JupyterLab 설치하기 아나콘다 다운로드 및 설치 - 아나콘다 다운로드 페이지 접속 (anacoda.com/products/distribution) - Anaconda Installers 항목을 찾아 운영 체제에 맞는 링크 클릭해 설치 파일 다운로드 - 설치 파일 실행해서 설치 - Anaconda Navigator 실행 프롬프트에서 파이썬 사용해보기 - Anacoda Prompt 실행 - 명령어 입력 칸에 python 입력 후 실행 2-2 JupyterLab과 친해지기 JupyterLab 실행하기 - 아나콘다 프롬프트 실행 - jupyter lab 입력하고 실행 노트북 다루기 셀을 이용해 명령어 실행 에디트 모드와 커맨드 모드 에디트 모드 : 셀에 코드를 입력하거나 수정할.. 1장 안녕, 파이썬? 1-1 데이터 분석과 파이썬 데이터 분석 분야에서 파이썬은 인기 있음 사용하는 곳 통계 분석 머신러닝 모델링 텍스트 마이닝 네트워크 분석 지도 시각화 주식 분석 이미지 분석 사운드 분석 소프트웨어 개발 1-2 파이썬이 강력한 데이터 분석 도구인 이유 무료로 사용 가능 데이터 분석을 대중화함 오픈 소스 생태계가 발달 됨 패키지 공유 소프트웨어 저장소 PyPI (https://pypi.org/) 깃허브, 콘다 교육 재료가 다양함 다양한 그래프를 만들 수 있음 전문적인 데이터 분석까지 가능한 프로그래밍 방식 재현성 확보 오류가 줄어듬 공동 작업 가능 ※ 해당 내용은 의 내용을 토대로 학습하며 정리한 내용입니다. 인공지능 시대의 비즈니스 전략 (4) 3부 실질적 실행 8장 데이터 활용의 단계 데이터는 분석하는 것이 아니라 활용하는 것 데이터가 분석을 하는 대상이라는 생각을 버려야 진정한 활용이 가능하당 데이터 분석을 통한 인사이트 발굴보다 훨씬 더 중요한 것은 '데이터 가치화' 진정한 데이터 활용은 인사이트와 새로 만들어낸 가치 데이터를 통해 '비즈니스를 변화'시키는 것 반드시 거처야 하는 단계 3단계까지는 동시 진행 하지만 그 이상은 뛰어넘을 수 없다 1단계 데이터 파악: 구체적으로 단순한 데이터 분석이든 머신러닝과 인공지능을 사용하기 위해서든 데이터는 필요하다 이러한 단계는 누군가 운영 시스템 코드와 데이터베이스를 일일이 뜯어봐야 하기 때문에 생각보다 어려운 일이다 2단계 파일럿 프로젝트: 데이터 분석하면 실패 2단계에서는 작고 빠르게 결과를 볼.. 이전 1 2 3 4 5 다음