본문 바로가기

반응형

인공지능(AI)

(139)
자연어 처리 (4) 2-5 구조 분석 어구 구조 분석: 단어 열로 구성된 어구를 통해 문장의 구조를 파악하는 방법 할당 분석: 단어와 단어 사이의 관계를 수치로 나타내고, 이를 분석하여 문장의 의미 파악, 주어진 문장을 구성하는 단어와 단어 사이의 관계를 수치화된 구조로 표현하고, 이를 바탕으로 기계적으로 처리해 관계를 파악하는 방법 술어절 구조 분석: 주격, 서술격, 목적격, 보격, 관형격, 부사격, 감탄격의 7가지로 구성되며 문장의 의미는 술어와 대상을 나타내는 명사구로 표현할 수 있으므로 이를 식별하는 처리를 의미함 딥러닝을 이용하는 방법: 딥러닝의 개념을 적용해 구조 분석을 수행하는 것, 구체적으로 RNN이 구조 분석에 사용 어구 구조 분석 단어열로 구성된 어구를 통해 문장의 구조를 파악하는 방법 동사구, 명사구, ..
자연어 처리 (3) 2-4 예측 기반 벡터 워드 임베딩(Word Embedding) 단어를 수치적으로 표현해 기계가 문맥의 흐름과 단어 간의 연관성을 이해할 수 있도록 개발된 방법 Word2Vec Word Embedding을 확장해 C++ 라이브러리로 개발한 것 CBOW(Continuous Bag of Words) Embedding: 주변에 있는 단어를 이용해 중간에 있는 단어를 예측하는 방법 Skip-Gram: 중간에 있는 단어로 주변 단어를 예측하는 방법 CBOW Embedding 신경망 언어 모형을 사용하면서 복수 단어 문맥(Multi-Word Context)에 대한 문제, 여러 개의 단어를 나열한 후 이와 관련된 단어를 추정하는 문제를 해결하기 위해 고안된 방법 Skip-Gram 중심단어를 이용해 주변 단어를 예측하..
자연어 처리 (2) 2-2 자연어 처리 기법 자연어 처리 기법의 종류 워드 임베딩(Word Embedding) 기법: 빈도수를 이용한 방법 횟수 기반 임베딩(Frequency-based Embedding): 단어의 빈도수를 바탕으로 하는 NLP방법, BOW, Count Vector, TF-IDF Vector 기법 예측 기반 벡터(Prediction-based Vector, Feed-forward 신경망 언어 모형): 단어 간의 관계를 벡터로 표현된 다차원 공간에서 유사도를 측정하고, 수치적 계산을 이용해 추론하는 방법, Word2Vec, CBOW, Skip-Gram 구조 분석: 문장의 구조 분석을 이용한 방법 어구 구조 분석, 할당 분석, 술어절 구조 분석 학습 및 예측을 통한 텍스트 생성 NLP 기법은 워드 임베딩, 구조..
자연어 처리 (1) 2-1 문장 구조의 이해 자연어 처리의 정의 기계가 자연어를 분석하고 해석해 의미를 이해한 후 그 결과를 바탕으로 사람에게 도움이나 피드백을 주는 것 언어: 자연어, 인공어, 컴퓨터 언어 문장 이해를 위한 선행 작업 문장을 이해하기 위해서는 '띄어쓰기'와 '형태소 분석'이 수행되어야 함 띄어쓰기: 공백을 기준으로 쓰인 문장의 단어를 구분 형태소 분석: 띄어쓰기로 분리한 단어의 품사를 인식하는 작업 형태소 분석 N-Gram 주어진 문장을 문자나 단어의 주어진 길이로 나눠 처리하는 방식 N-Gram으로 분석된 것을 통칭하는 개념: BOW(Bag of Words) ※ 해당 내용은 의 내용을 토대로 학습하며 정리한 내용입니다.
이미지와 음성 패턴 인식 (3) 1-3 음성 인식 음성 인식 방법 사람의 말하는 소리에는 특정 주파수가 있고, 이 소리의 진폭을 Fourier Transform 하면 주파수의 특징을 알 수 있음 어떤 시간 영역에서 뽑은 진폭을 주파수 영역으로 변환했을 때 볼 수 있는 피크를 '포먼트(Formant)'라고 함, 한국어는 1~3 포먼트 주파수의 조합에 따라 모음의 음소를 알 수 있음 목소리는 성대의 진동으로 발생, 성도(Vocal Tract)를 통과하면서 필터에 걸리고, 공기의 진동이 발생해 목소리가 울림 음원의 성대는 소스가 되고, 필터의 조합으로 소리가 들리므로 이를 '소스-필터 이론(Source-Filter Theory)'라고 함 음성을 텍스트로 인식하려면 음성을 분해하는 모델(음성 모델)과 분해된 음성을 문장으로 변환하는 모델(언어..
이미지와 음성 패턴 인식 (2) 1-2 이미지 인식 컴퓨터 비전(Computer Vision) 픽셀로 구성된 디지털 이미지를 기계가 이해할 수 있게 만드는 연구 영역 이미지 인식이 중요함 디지털 이미지의 표현 컴퓨터 비전의 처리 과정 화상 처리 단계(Image Processing Stage): 화상을 이용하기 쉬운 형태로 변경한 후 다양한 필터링을 이용해 잡음을 줄이고 이미지를 구분하기 위한 선의 식별 및 영역 발견의 작업을 수행하는 것 배경 분석 단계(Scene Analysis Stage): 화상에 필요한 정보를 생성해내는 단계 컴퓨터 비전의 연구 분야 및 관련 기술 이미지 인식을 포함하는 컴퓨터 비전의 궁극적인 목적은 정지 이미지와 정지 이미지의 연속 데이터인 동영상이 무엇을 의미하는지를 자동으로 분석하는 것 사물이나 문자의 식별과..
이미지와 음성 패턴 인식 (1) 1-1 패턴 인식 계산이 가능한 기계적인 장치가 어떠한 대상을 인식하는 문제를 다루는 인공지능의 한 분야 패턴 인식의 응용 분야 문자 인식 분야 생체 인식과 인간 행동 패턴 분석 분야 진단 시스템 분야 예측 시스템 분야 보안과 군사 분야 패턴과 특징 특징(Feature): 어떤 대상이 갖고 있는 고유의 분별 가능한 측면(Aspect), 질(Quality), 특성(Characteristic) 패턴(Pattern): 개별 대상의 특색(Traits)이나 특징의 집합 특징 벡터: 특정 대상의 특징이 하나 이상의 값을 가질 때 열 벡터로 표현하는 것 특징 공간: 특정 대상의 특징 벡터가 정의되는 차원의 공간 분산 플롯: 인식 대상이 되는 대상을 특징 공간에서 특징 벡터가 형성하는 점으로 표현하는 것 특징 벡터 선..
인공지능 모델의 평가 9-1 인공지능 모델의 평가 방법 이진 분류의 평가 기법 홀더아웃 검증과 교차 검증 오차 행렬(Confusion Matrix)을 조사하는 방법: 정밀도, 재현율, PR곡선 ROC 곡선 다중 분류의 평가 기법 일대다 전략(OvA: One versus ALL): 각 분류기의 결정 점수 중 가장 높은 것을 선택하는 방식 일대일 전략(OvO: One versus One): 각 숫자의 조합마다 이진 분류기를 훈련하는 것 9-2 모델을 평가할 때 알아야 하는 용어 훈련 오차와 테스트 오차 훈련 오차: 학습 과정에서 발생하는 오차 테스트 오차: 학습이 완료된 후 테스트 데이터를 이용할 때 발생하는 오차 과적합 문제 모델의 층이 많아져 복잡해지면 발생할 수 있는 문제 규제화 기법: 오차 함수 또는 목적 함수를 오차 항..
딥러닝 (3) 8-8 합성곱 신경망(CNN: Convolution Neural Network) 딥러닝 모델 중 가장 기본이 되는 다층 퍼셉트론 모델로 이미지의 인식, 예측 등에 활용 영상 인식 분야에서 가장 많이 사용 합성곱 신경망의 특징 여러개의 완전 연결 계층과 활성화 함수를 사용하는 대신, 합성곱 계층(Convolution Layer)과 풀링 계층(Pooling Layer)을 활성화 함수의 앞과 뒤에 배치하는 형태 이미지 배열 표현의 문제점 이미지 데이터를 1차원의 데이터로 펼쳐 입력층에 넣어야 함 원데이터가 갖는 형상, 공간적 구조가 무시됨 모델의 이미지 인식 성능을 저하시키는 요인으로 이미지 데이터는 공간 구조를 고려하는 조작이 필요 합성곱 계층의 계산 원리 완전 연결 계층이 이미지 데이터가 갖는 공간적 구조..
딥러닝 (2) 8-4 제한 볼츠만 머신과 심층 신뢰 신경망 다층 퍼셉트로넹서 역전파 작업을 수행할 때 3개 층 이상이 되면 기울기 소실 문제(Vanishing Gradient Problem)가 발생해 입력값이 출력값에 영향을 미치지 못함 이는 모델 초기의 Weight에 대한 설정이 미숙하기 때문에 나타나는 문제 모델의 변숫값을 초기화하기 위한 방안으로 제한 볼츠만 머신(RBM: Restricted Boltzmann Machine) 제시 제한 볼츠만 머신은 2개 층으로 구성 제한 볼츠만 머신을 여러 층으로 쌓은 형태가 심층 볼츠만 머신 심층 신뢰 신경망(DBN: Deep Belief Network): 제한 볼츠만 머신을 이용한 다층화 8-5 오토인코더 입출력층의 뉴런 수가 동일하며, 1개의 숨어 있는 계층(Hidden ..

반응형