본문 바로가기

텍스트 마이닝

텍스트 마이닝 기초 (2)

반응형

1.4 텍스트 마이닝의 주요 적용 분야

1.4.1 문서 분류

  • 주어진 문서에 대해 미리 정의된 클래스로 분류하는 작업
  • 메일의 내용을 분석해 스팸 메일의 여부 결정
  • 문서의 내용이 호의적인지, 비호의적인지 확인
  • 자연어 처리 및 텍스트 마이님에서 가장 기본적이면서 활용범위가 가장 넓은 분야

1.4.2 문서 생성

  • 사람이 쓴 것과 유사한 문장을 만들어내는 작업
  • 입력 데이터가 없다는 차이점을 가짐
  • 아직 실질적인 응용분야는 많 않음

1.4.3 문서 요약

  • 주어진 문서에서 중요하고 흥미 있는 내용을 추출해 요약문을 생성하는 작업
  • sequence-to-sequence 문제, 단어의 시퀀스를 입력받아 다시 단어의 시퀀스를 출력하는 문제가 전형적인 예

1.4.4 질의응답

  • 주어진 문장을 읽고, 주어진 문제에 대해 올바른 답을 생성하는 작업
  • ChatGPT와 같이 현재 큰 주목을 받는 챗봇의 주요 미래 기술

1.4.5 기계번역

  • 자연어 처리를 발전하게 한 출발점인 동시에 가장 중요한 분야 중 하나
  • 두 언어체계를 완벽하게 이해해야 하므로 자연어 이해를 전제로 함

1.4.6 토픽 모델링

  • 여러 문서에서 공통으로 등장하는 토픽을 추출하는 방법
  • 다수의 문서에 잠재된 내용을 파악하는 데 활용

 

 

 

 

※ 해당 내용은 <파이썬 텍스트 마이닝 완벽 가이드>의 내용을 토대로 학습하며 정리한 내용입니다.

반응형

'텍스트 마이닝' 카테고리의 다른 글

텍스트 전처리 (4)  (0) 2023.06.21
텍스트 전처리 (3)  (0) 2023.06.20
텍스트 전처리 (2)  (0) 2023.06.19
텍스트 전처리 (1)  (0) 2023.06.18
텍스트 마이닝 기초 (1)  (0) 2023.06.16