본문 바로가기

반응형

전체 글

(291)
자연어 처리 (2) 2-2 자연어 처리 기법 자연어 처리 기법의 종류 워드 임베딩(Word Embedding) 기법: 빈도수를 이용한 방법 횟수 기반 임베딩(Frequency-based Embedding): 단어의 빈도수를 바탕으로 하는 NLP방법, BOW, Count Vector, TF-IDF Vector 기법 예측 기반 벡터(Prediction-based Vector, Feed-forward 신경망 언어 모형): 단어 간의 관계를 벡터로 표현된 다차원 공간에서 유사도를 측정하고, 수치적 계산을 이용해 추론하는 방법, Word2Vec, CBOW, Skip-Gram 구조 분석: 문장의 구조 분석을 이용한 방법 어구 구조 분석, 할당 분석, 술어절 구조 분석 학습 및 예측을 통한 텍스트 생성 NLP 기법은 워드 임베딩, 구조..
자연어 처리 (1) 2-1 문장 구조의 이해 자연어 처리의 정의 기계가 자연어를 분석하고 해석해 의미를 이해한 후 그 결과를 바탕으로 사람에게 도움이나 피드백을 주는 것 언어: 자연어, 인공어, 컴퓨터 언어 문장 이해를 위한 선행 작업 문장을 이해하기 위해서는 '띄어쓰기'와 '형태소 분석'이 수행되어야 함 띄어쓰기: 공백을 기준으로 쓰인 문장의 단어를 구분 형태소 분석: 띄어쓰기로 분리한 단어의 품사를 인식하는 작업 형태소 분석 N-Gram 주어진 문장을 문자나 단어의 주어진 길이로 나눠 처리하는 방식 N-Gram으로 분석된 것을 통칭하는 개념: BOW(Bag of Words) ※ 해당 내용은 의 내용을 토대로 학습하며 정리한 내용입니다.
이미지와 음성 패턴 인식 (3) 1-3 음성 인식 음성 인식 방법 사람의 말하는 소리에는 특정 주파수가 있고, 이 소리의 진폭을 Fourier Transform 하면 주파수의 특징을 알 수 있음 어떤 시간 영역에서 뽑은 진폭을 주파수 영역으로 변환했을 때 볼 수 있는 피크를 '포먼트(Formant)'라고 함, 한국어는 1~3 포먼트 주파수의 조합에 따라 모음의 음소를 알 수 있음 목소리는 성대의 진동으로 발생, 성도(Vocal Tract)를 통과하면서 필터에 걸리고, 공기의 진동이 발생해 목소리가 울림 음원의 성대는 소스가 되고, 필터의 조합으로 소리가 들리므로 이를 '소스-필터 이론(Source-Filter Theory)'라고 함 음성을 텍스트로 인식하려면 음성을 분해하는 모델(음성 모델)과 분해된 음성을 문장으로 변환하는 모델(언어..

반응형