IT grow. 2018. 9. 10. 03:43
반응형

Wordcloud 란 무엇인가??


1.     Display most frequent words appearing in texts

2.     Size is related with frequency

3.     Bigger size à more frequent

4.     Similar frequency words in similar size and color



1. 텍스트에 나타나는 가장 빈번한 단어 표시

2. 크기는 주파수와 관련이 있습니다.

3. 더 큰 사이즈에서 더 자주

4. 비슷한 크기와 색상의 유사 주파수 단어

 

Wordcloud 를 알기위한 알고리즘은 무엇인가??

예제를 보자.

1.     John 은 망고를 먹는다.

2.     John은 농구를 한다.

3.     Nadal은 망고를 먹는다

4.     Nadal은 테니스를 한다.

 

R 알고리즘 형식으로 이해를 해보자.

Step 1 : List of words

è  John | 먹는다 | 망고를 | 한다 | 농구 | Nadal | 테니스

Step 2 : tagging presence

è  단어 들의 선택 횟수를 문장별로 .

밑에 사진은 1~4번에 해당하는 문자들을 존재하는 숫자대로 나타낸 것이다.


John은 2번 사용이 되었고 , Eats 도 2번 .... 이렇게 마지막 Tennis까지 횟수를 나타내 보았다.


이렇게 통계된 단어들을 wordcloud를 통해서 다음과 같이 통계화 할 수 있다. 

통계값이 같은 것들은 같은 색깔을 띄는 것을 볼 수 있다.









반응형