Wordcloud
Wordcloud 란 무엇인가??
1. Display most frequent words appearing in texts
2. Size is related with frequency
3. Bigger size à more frequent
4. Similar frequency words in similar size and color
1. 텍스트에 나타나는 가장 빈번한 단어 표시
2. 크기는 주파수와 관련이 있습니다.
3. 더 큰 사이즈에서 더 자주
4. 비슷한 크기와 색상의 유사 주파수 단어
Wordcloud 를 알기위한 알고리즘은 무엇인가??
예제를 보자.
1. John 은 망고를 먹는다.
2. John은 농구를 한다.
3. Nadal은 망고를 먹는다
4. Nadal은 테니스를 한다.
R 알고리즘 형식으로 이해를 해보자.
Step 1 : List of words
è John | 먹는다 | 망고를 | 한다 | 농구 | Nadal | 테니스
Step 2 : tagging presence
è 단어 들의 선택 횟수를 문장별로 .
밑에 사진은 1~4번에 해당하는 문자들을 존재하는 숫자대로 나타낸 것이다.
John은 2번 사용이 되었고 , Eats 도 2번 .... 이렇게 마지막 Tennis까지 횟수를 나타내 보았다.
이렇게 통계된 단어들을 wordcloud를 통해서 다음과 같이 통계화 할 수 있다.
통계값이 같은 것들은 같은 색깔을 띄는 것을 볼 수 있다.