본문 바로가기

반응형

분류 전체보기

(291)
4장 데이터 프레임의 세계로 (1) 4-1 데이터 프레임 이해하기 - 데이터는 어떻게 생겼나? 데이터 프레임(data frame)은 데이터를 다룰 때 가장 많이 사용하는 데이터 형태로, 행과 열로 구성된 사각형 모양의 표처럼 생김 '열'은 속성-컬럼(column), 변수(variable) '행'은 정보-로(row), 케이스(case) 한 사람의 정보는 가로 한 줄에 나열 하나의 단위가 하나의 행 데이터가 크다 = 행이 많다 or 열이 많다 데이터 분석 시에는 열이 많은 것이 중요함 행이 많다 -> 컴퓨터가 느려짐 -> 고사양 장비 구축 열이 많다 -> 분석 방법의 한계 -> 고급 분석 방법 4-2 데이터 프레임 만들기-시험 성적 데이터 만들기 데이터 입력해 데이터 프레임 만들기 pandas 패키지 로드 import pandas as pd ..
3장 데이터 분석에 필요한 연장 챙기기 (2) 3-3 함수 꾸러미, '패키지' 이해하기 패키지에는 다양한 함수들이 들어있음 ex) 그래프를 만들때 사용하는 패키지 seaborn에는 scatterplot(), barplot(), lineplot() 등 수십 가지 그래프 관련 함수가 있음 스마트폰에 앱을 깔듯 입맛대로 골라 설치 가능 패키지 활용하기 패키지 로드 import seaborn 패키지 함수 사용 var = ['a', 'a', 'b', 'c'] var ##출력: ['a', 'a', 'b', 'c'] seaborn.countplot(x = var) 패키지 약어 활용하기 import seaborn as sns sns.countplot(x = var) seaborn의 titanic 데이터로 그래프 만들기 seaborn의 load_dataset()으로..
3장 데이터 분석에 필요한 연장 챙기기 (1) 3-1 변하는 수, '변수' 이해하기 변수(variable)는 변하는 수 데이터는 변수의 덩어리 변수는 데이터 분석의 대상 데이터 분석은 변수 간에 어떤 관계가 있는지 파악하는 작업 상수(constant)는 분석할 것이 없다 변수 만들기 a = 1 a ## 출력: 1 b = 2 b ##출력: 2 c = 3 c ##출력: 3 d = 3.5 d ##출력: 3.5 a + b ##출력: 3 a + b + c ##출력: 6 4 / b ##출력: 2.0 5 * b ##출력: 10 변수명은 알아보기 쉽고 잘 기억되도록 의미를 담아 정함 변수명은 문자, 숫자, 언더바(_)를 조합해서 만듬 반드시 문자로 시작해야 함 대소문자를 구분 여러 값으로 구성된 변수 만들기 var1 = [1,2,3] var1 ##출력: [1, 2..
2장 파이썬 데이터 분석 환경 만들기 2-1 아나콘다로 파이썬과 JupyterLab 설치하기 아나콘다 다운로드 및 설치 - 아나콘다 다운로드 페이지 접속 (anacoda.com/products/distribution) - Anaconda Installers 항목을 찾아 운영 체제에 맞는 링크 클릭해 설치 파일 다운로드 - 설치 파일 실행해서 설치 - Anaconda Navigator 실행 프롬프트에서 파이썬 사용해보기 - Anacoda Prompt 실행 - 명령어 입력 칸에 python 입력 후 실행 2-2 JupyterLab과 친해지기 JupyterLab 실행하기 - 아나콘다 프롬프트 실행 - jupyter lab 입력하고 실행 노트북 다루기 셀을 이용해 명령어 실행 에디트 모드와 커맨드 모드 에디트 모드 : 셀에 코드를 입력하거나 수정할..
1장 안녕, 파이썬? 1-1 데이터 분석과 파이썬 데이터 분석 분야에서 파이썬은 인기 있음 사용하는 곳 통계 분석 머신러닝 모델링 텍스트 마이닝 네트워크 분석 지도 시각화 주식 분석 이미지 분석 사운드 분석 소프트웨어 개발 1-2 파이썬이 강력한 데이터 분석 도구인 이유 무료로 사용 가능 데이터 분석을 대중화함 오픈 소스 생태계가 발달 됨 패키지 공유 소프트웨어 저장소 PyPI (https://pypi.org/) 깃허브, 콘다 교육 재료가 다양함 다양한 그래프를 만들 수 있음 전문적인 데이터 분석까지 가능한 프로그래밍 방식 재현성 확보 오류가 줄어듬 공동 작업 가능 ※ 해당 내용은 의 내용을 토대로 학습하며 정리한 내용입니다.
인공지능 시대의 비즈니스 전략 (4) 3부 실질적 실행 8장 데이터 활용의 단계 데이터는 분석하는 것이 아니라 활용하는 것 데이터가 분석을 하는 대상이라는 생각을 버려야 진정한 활용이 가능하당 데이터 분석을 통한 인사이트 발굴보다 훨씬 더 중요한 것은 '데이터 가치화' 진정한 데이터 활용은 인사이트와 새로 만들어낸 가치 데이터를 통해 '비즈니스를 변화'시키는 것 반드시 거처야 하는 단계 3단계까지는 동시 진행 하지만 그 이상은 뛰어넘을 수 없다 1단계 데이터 파악: 구체적으로 단순한 데이터 분석이든 머신러닝과 인공지능을 사용하기 위해서든 데이터는 필요하다 이러한 단계는 누군가 운영 시스템 코드와 데이터베이스를 일일이 뜯어봐야 하기 때문에 생각보다 어려운 일이다 2단계 파일럿 프로젝트: 데이터 분석하면 실패 2단계에서는 작고 빠르게 결과를 볼..
인공지능 시대의 비즈니스 전략 (3) 2부 경영의 변화 5장 왜 변화가 필요한가 뒤에 숨겨진 과정들 일본의 안경업체 JINS는 2016년 11월부터 인공지능을 활용하여 고객에게 어울리는 안경을 추천하는 JINS BRAIN이라는 서비스를 제공하고 있다. 이러한 사례 이면에 숨어 있는 일에는 다음과 같이 여러 일이 있었을 것이다. 두뇌 한계를 뛰어넘기 위한 도구 인공지능이라는 도구는 인간 두뇌의 인지와 판단 범위를 넘기 위한 도구다 인간의 이해 범위 안에서 이뤄지는 기존 방식을 그대로 고수해서는 인공지능을 제대로 활용할 수 없다 결국은 변화 관리 과거 영국의 붉은 깃발 법(Rea Flag Act, 적기 조례)은 정부의 잘못된 규제를 비판하기 위해서 자주 언급되는 법이다 이러한 법으로 인해 영국은 자동차 산업의 주도권을 놓치게 되었다 이와 같이 ..
인공지능 시대의 비즈니스 전략 (2) 3장 도구로서의 인공지능 머신러닝이 하는 데이터 분석 보통 데이터를 활용한다고 하면 거의 데이터 분석을 의미 기업에서 데이터를 활용해 판단해야 하는 것 다양한 경우의 숫자를 계산하고, 수많은 경우의 수를 비교하고, 의미 있는 차이를 찾아내느 것을 데이터 분석이라 한다면 컴퓨터가 인간에 비해 월등하다 금융업계에서 대표적인 인공지능 활용 사례로 켄쇼가 있다 이는 인공지능을 분석에 활용하는 전형적 사례 자연어 처리와 머신러닝을 활용해 기사와 자료 검색부터 시장 동향 분석, 투자 조언까지 제공하는 금융 분석 프로그램 의료 분야에서는 IBM의 왓슨이 대표적이다 왓슨은 엄청난 양의 의학 자료, 학술지, 임상 시험 데이터, 의학 교과서 들을 통해 학습하여 적절한 정보를 제공하여 의사를 도와줌 분석을 프로세스 안으로 ..
인공지능 시대의 비즈니스 전략 (1) 서론 인공지능 활용에 필요한 세 가지 1부 도구의 이해 1장 인공지능이랑 무엇인가 인공지능은 도구로서의 성질을 빨리 이해하고 활용하는 편이 좋다 어떤 종류의 산업이든 인공지능의 활용은 선택의 문제가 아니라 필수이다 인공지능의 구성 요소 인공지능에 대해 분리하고, 구분해서 인식해야 한다 2장 머신러닝이란 무엇인가 머신러닝은 컴퓨터가 데이터를 통해 스스로 학습하는 것처럼 하는 기술이다 - 기존의 컴퓨터 활용 방식 - 머신러닝을 통한 컴퓨터 활용 컴퓨터가 데이터에서 스스로 방법을 찾기 때문에 인간이 일일이 지시할 필요가 없음 컴퓨터 사용의 근본 개념을 바꾸었다는 측면에서 의미를 가짐 작동 방식에 따라 나눈 유형 딥러닝은 인공신경망을 심화시킨 알고리즘이다 - 딥러닝의 하위 종류 ※ 해당 내용은 의 내용을 토대로..
9장 텍스트 분류 - 순환신경망 (5) 9-4 LSTM 순환 신경망으로 텍스트 분류 - LSTM 타임 스텝이 멀리 떨어진 영단어 사이의 관계를 파악하기 위함 1997년 호크라이터와 슈미트후버가 고안한 것으로, 그레이디언트 소실(vanishing gradient) 문제를 극복하여 긴 시퀀스를 성공적으로 모델링하게 됨 셀의 구조 - 텐서플로로 LSTM 순환 신경망 만들기 1. LSTM 순환 신경망 만들기 from tensorflow.keras.layers import LSTM model_lstm = Sequential() model_lstm.add(Embedding(1000, 32)) model_lstm.add(LSTM(8)) model_lstm.add(Dense(1, activation='sigmoid')) model_lstm.summary()..

반응형