최대한 친절하게 쓴 R로 낱말구름, 의미연결망 그리기(feat. tidyverse, KoNLP)
위에 있는 사진은 도널드 트럼프 미국 대통령이 지난해 11월 8일 국회를 찾아 연설한 내용을 낱말구름(워드클라우드) 형태로 정리한 겁니다. 당연히 R를 활용해 텍스트 데이터를 정리했습니다. (최종 결과물을 만들 때는 어도비 포토샵 도움도 받았습니다.) R는 이렇게 숫자뿐 아니라 텍스트 데이터를 분석하고 정리하는 데도 일가견이 있습니다. 이런 작업을 흔히 텍스트 마이닝(text mining)이라고 부릅니다. 이 포스트를 읽고 계신 분 대다수는 인터넷 포털 사이트 등에 R 관련 검색어를 넣어 찾아오셨을 테니 이미 R가 무엇인지 알고 계실 겁니다. 그래도 혹시 모르시는 분들께 R 홈페이지에 올라온 자기소개를 따라 말씀드리면 "R는 통계 계산과 그래픽에 활용하는 무료 소프트웨어 환경(R is a free sof..