본문 바로가기

반응형

워드 클라우드

(3)
그래프와 워드 클라우드 (2) 3.2 워드 클라우드로 내용을 한눈에 보기 워드 클라우드: 텍스트 분석 결과를 보여주는 시각화 도구 중 가장 많이 활용되는 방법 !pip install wordcloud from wordcloud import WordCloud # Generate a word cloud image wordcloud = WordCloud().generate(doc_alice) plt.axis("off") plt.imshow(wordcloud, interpolation='bilinear') #이미지를 출력 plt.show() wordcloud.to_array().shape ## (200, 400, 3) wordcloud = WordCloud(max_font_size=60).generate_from_frequencies(ali..
10장 텍스트 마이닝 (3) 10-2 기사 댓글 텍스트 마이닝 가장 많이 사용된 단어 알아보기 1. 기사 댓글 불러오기 # 데이터 불러오기 df = pd.read_csv('news_comment_BTS.csv', encoding = 'UTF-8') # 데이터 살펴보기 df.info() """ RangeIndex: 1200 entries, 0 to 1199 Data columns (total 5 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 reg_time 1200 non-null object 1 reply 1200 non-null object 2 press 1200 non-null object 3 title 1200 non-null object 4..
10장 텍스트 마이닝 (2) 10-1 대통령 연설문 텍스트 마이닝 워드 클라우드 만들기 워드 클라우드(word cloud): 단어의 빈도를 구름 모양으로 표현한 그래프 1. wordcloud 패키지 설치하기 !pip install wordcloud 2. 한글 폰트 설정하기 font = 'DoHyeon-Regular.ttf' 3. 단어와 빈도를 담은 딕셔너리 만들기 # 데이터 프레임을 딕셔너리로 변환 dic_word = df_word.set_index('word').to_dict()['n'] dic_word """ {'나라': 19, '일자리': 19, '국민': 18, '우리': 17, '대통령': 12, '대한민국': 11, '확대': 11, '정치': 10, '우리나라': 10, '사회': 9, '사람': 9, '성장': 9, ..

반응형