본문 바로가기

텍스트 마이닝

그래프와 워드 클라우드 (2)

반응형

3.2 워드 클라우드로 내용을 한눈에 보기

  • 워드 클라우드: 텍스트 분석 결과를 보여주는 시각화 도구 중 가장 많이 활용되는 방법
!pip install wordcloud
from wordcloud import WordCloud

# Generate a word cloud image
wordcloud = WordCloud().generate(doc_alice)

plt.axis("off")
plt.imshow(wordcloud, interpolation='bilinear') #이미지를 출력
plt.show()

wordcloud.to_array().shape

## (200, 400, 3)
wordcloud = WordCloud(max_font_size=60).generate_from_frequencies(alice_word_count)
plt.figure()
plt.axis("off")
plt.imshow(wordcloud, interpolation="bilinear")
plt.show()

import numpy as np
from PIL import Image

alice_mask = np.array(Image.open("alice_mask.png")) # 배경이미지를 불러와서 numpy array로 변환
wc = WordCloud(background_color="white", # 배경색 지정
               max_words=30, # 출력할 최대 단어 수
               mask=alice_mask, # 배경으로 사용할 이미지
               contour_width=3,  # 테두리선의 크기
               contour_color='steelblue') # 테두리선의 색

wc.generate_from_frequencies(alice_word_count) # 워드 클라우드 생성

wc.to_file("alice.png") # 결과를 이미지 파일로 저장

# 화면에 결과를 출력
plt.figure()
plt.axis("off")
plt.imshow(wc, interpolation='bilinear')
plt.show()

 

 

 

 

 

※ 해당 내용은 <파이썬 텍스트 마이닝 완벽 가이드>의 내용을 토대로 학습하며 정리한 내용입니다.

반응형

'텍스트 마이닝' 카테고리의 다른 글

카운트 기반의 문서 표현 (1)  (0) 2023.06.25
그래프와 워드 클라우드 (3)  (0) 2023.06.24
그래프와 워드 클라우드 (1)  (0) 2023.06.22
텍스트 전처리 (4)  (0) 2023.06.21
텍스트 전처리 (3)  (0) 2023.06.20