본문 바로가기

반응형

자연어 처리

(6)
머신러닝에서의 액티브 러닝 (4) 능동적 학습 알고리즘 및 예시 액티브 러닝은 가장 유익한 사례를 통해 학습할 수 있는 독특한 능력을 가지고 있기 때문에 다양한 분야에서 가치 있는 접근법이 될 수 있습니다. 이러한 머신 러닝 하위 범주는 기존의 ML 접근 방식이 정확한 결과를 제공하기 어려울 수 있는 복잡하고 종종 모호한 데이터를 다루고 있습니다. 액티브 러닝의 이러한 활용 사례에 대해 자세히 알아보겠습니다. 컴퓨터 비전 - 물체 감지: 거리의 영상에서 다양한 종류의 차량을 식별하기 위해 모델을 교육한다고 가정합니다. 새롭고 독특한 차량 디자인이 등장함에 따라 능동적인 학습을 통해 모델이 낯선 사례를 식별하고 레이블을 요청할 수 있으며, 이를 통해 모델이 최신 상태를 유지하고 새로운 차량 종류를 정확하게 인식할 수 있습니다. - 이미지 ..
자연어 처리 (5) 2-6 텍스트 생성 기계 번역 자동화된 번역을 말하며, 언어를 또 다른 언어로 번역하는 기능 제공 구문 기반의 기계 번역 번역 모델: 원래 언어 구문과 목적 언어 구분을 대조하는 사전이 있고, 대조 구문 각 쌍에 각각의 점수를 부여한 상태로 저장 정렬 모델: 디코딩할 때 정렬하는 것이 자연스러운 형태인지 확률로 추정한 후 필요에 따라 정렬 언어 모델: 출력할 구문을 유려한 문장으로 만드는 작업 수행 자동 요약 같은 요약은 같은 언어 안에서 문장을 변환하는 것 자동 요약 단일 문서에 적용할 때 주로 사용하는 추출형 요약을 위한 기술 통계 요약(Maximal Marginal Relvance, MMR) 알고리즘 사용 증가하는 문서를 효과적으로 정리하는 방안으로 도입된 것 이미지의 설명 추가 및 기타 분야 집중..
자연어 처리 (4) 2-5 구조 분석 어구 구조 분석: 단어 열로 구성된 어구를 통해 문장의 구조를 파악하는 방법 할당 분석: 단어와 단어 사이의 관계를 수치로 나타내고, 이를 분석하여 문장의 의미 파악, 주어진 문장을 구성하는 단어와 단어 사이의 관계를 수치화된 구조로 표현하고, 이를 바탕으로 기계적으로 처리해 관계를 파악하는 방법 술어절 구조 분석: 주격, 서술격, 목적격, 보격, 관형격, 부사격, 감탄격의 7가지로 구성되며 문장의 의미는 술어와 대상을 나타내는 명사구로 표현할 수 있으므로 이를 식별하는 처리를 의미함 딥러닝을 이용하는 방법: 딥러닝의 개념을 적용해 구조 분석을 수행하는 것, 구체적으로 RNN이 구조 분석에 사용 어구 구조 분석 단어열로 구성된 어구를 통해 문장의 구조를 파악하는 방법 동사구, 명사구, ..
자연어 처리 (3) 2-4 예측 기반 벡터 워드 임베딩(Word Embedding) 단어를 수치적으로 표현해 기계가 문맥의 흐름과 단어 간의 연관성을 이해할 수 있도록 개발된 방법 Word2Vec Word Embedding을 확장해 C++ 라이브러리로 개발한 것 CBOW(Continuous Bag of Words) Embedding: 주변에 있는 단어를 이용해 중간에 있는 단어를 예측하는 방법 Skip-Gram: 중간에 있는 단어로 주변 단어를 예측하는 방법 CBOW Embedding 신경망 언어 모형을 사용하면서 복수 단어 문맥(Multi-Word Context)에 대한 문제, 여러 개의 단어를 나열한 후 이와 관련된 단어를 추정하는 문제를 해결하기 위해 고안된 방법 Skip-Gram 중심단어를 이용해 주변 단어를 예측하..
자연어 처리 (2) 2-2 자연어 처리 기법 자연어 처리 기법의 종류 워드 임베딩(Word Embedding) 기법: 빈도수를 이용한 방법 횟수 기반 임베딩(Frequency-based Embedding): 단어의 빈도수를 바탕으로 하는 NLP방법, BOW, Count Vector, TF-IDF Vector 기법 예측 기반 벡터(Prediction-based Vector, Feed-forward 신경망 언어 모형): 단어 간의 관계를 벡터로 표현된 다차원 공간에서 유사도를 측정하고, 수치적 계산을 이용해 추론하는 방법, Word2Vec, CBOW, Skip-Gram 구조 분석: 문장의 구조 분석을 이용한 방법 어구 구조 분석, 할당 분석, 술어절 구조 분석 학습 및 예측을 통한 텍스트 생성 NLP 기법은 워드 임베딩, 구조..
자연어 처리 (1) 2-1 문장 구조의 이해 자연어 처리의 정의 기계가 자연어를 분석하고 해석해 의미를 이해한 후 그 결과를 바탕으로 사람에게 도움이나 피드백을 주는 것 언어: 자연어, 인공어, 컴퓨터 언어 문장 이해를 위한 선행 작업 문장을 이해하기 위해서는 '띄어쓰기'와 '형태소 분석'이 수행되어야 함 띄어쓰기: 공백을 기준으로 쓰인 문장의 단어를 구분 형태소 분석: 띄어쓰기로 분리한 단어의 품사를 인식하는 작업 형태소 분석 N-Gram 주어진 문장을 문자나 단어의 주어진 길이로 나눠 처리하는 방식 N-Gram으로 분석된 것을 통칭하는 개념: BOW(Bag of Words) ※ 해당 내용은 의 내용을 토대로 학습하며 정리한 내용입니다.

반응형