반응형
대통령 연설문 텍스트마이닝 해보기
학부공부/데이터마이닝과통계2018. 9. 18. 13:33대통령 연설문 텍스트마이닝 해보기

역대 대통령님들 께서 연설문에서 어떤 말들을 많이 하였을까. 다음 library를 로딩해주자 . 만약 없다면 install.packages(" " )를 통해 다운받자. library(KoNLP)library(RColorBrewer)library(wordcloud) library(KoNLP)를 로딩시키면 useSejongDic을 사용할 수 있게 되는데 , 한글 '세종사전' 이라고 한다. useSejongDic 이제 팔레트를 생성해 준다. pal2

통계치를 통해서 전입수가 제일 많은 지역을 나타내 보자
학부공부/데이터마이닝과통계2018. 9. 15. 01:23통계치를 통해서 전입수가 제일 많은 지역을 나타내 보자

통계치를 통해서 데이터를 시각화 해 볼것인데 , wordcloud를 통해서 나타내 볼 것이다 . 그 전에 다음 사이트를 들어가서 통계치를 다운 받아야 하는데 , 다운 받을 때 CSV 파일로 다운 받아야 한다 . 그런데 다운 받아보면 우리가 실습하는 환경과 데이터가 약간 다르기 때문에 파일은 올려 두겠다. --> 우선 통계청 사이트는 다음과 같다 : www.kostat.go.kr 우리는 다음과 같이 출력해 볼 것이다. library(wordcloud)library(RColorBrewer)# wordcloud와 RColorBrewer이 필요하다 # 없다면 install.packages("wordcloud")을 통해서 다운받자. # 아니면 Rstudio 내에서 Packages 탭에 install을 통해서 다운..

Wordcloud
학부공부/데이터마이닝과통계2018. 9. 10. 03:43Wordcloud

Wordcloud 란 무엇인가?? 1. Display most frequent words appearing in texts2. Size is related with frequency 3. Bigger size à more frequent4. Similar frequency words in similar size and color 1. 텍스트에 나타나는 가장 빈번한 단어 표시2. 크기는 주파수와 관련이 있습니다.3. 더 큰 사이즈에서 더 자주4. 비슷한 크기와 색상의 유사 주파수 단어 Wordcloud 를 알기위한 알고리즘은 무엇인가??예제를 보자.1. John 은 망고를 먹는다.2. John은 농구를 한다.3. Nadal은 망고를 먹는다4. Nadal은 테니스를 한다. R 알고리즘 형식으로 이해를 해보자..

반응형
image