Wordcloud 란 무엇인가??
1. Display most frequent words appearing in texts
2. Size is related with frequency
3. Bigger size à more frequent
4. Similar frequency words in similar size and color
1. 텍스트에 나타나는 가장 빈번한 단어 표시
2. 크기는 주파수와 관련이 있습니다.
3. 더 큰 사이즈에서 더 자주
4. 비슷한 크기와 색상의 유사 주파수 단어
Wordcloud 를 알기위한 알고리즘은 무엇인가??
예제를 보자.
1. John 은 망고를 먹는다.
2. John은 농구를 한다.
3. Nadal은 망고를 먹는다
4. Nadal은 테니스를 한다.
R 알고리즘 형식으로 이해를 해보자.
Step 1 : List of words
è John | 먹는다 | 망고를 | 한다 | 농구 | Nadal | 테니스
Step 2 : tagging presence
è 단어 들의 선택 횟수를 문장별로 .
밑에 사진은 1~4번에 해당하는 문자들을 존재하는 숫자대로 나타낸 것이다.
John은 2번 사용이 되었고 , Eats 도 2번 .... 이렇게 마지막 Tennis까지 횟수를 나타내 보았다.
이렇게 통계된 단어들을 wordcloud를 통해서 다음과 같이 통계화 할 수 있다.
통계값이 같은 것들은 같은 색깔을 띄는 것을 볼 수 있다.
'학부공부 > 데이터마이닝과통계' 카테고리의 다른 글
R에서의 사칙연산은 어떻게 되는 것일까. (0) | 2018.09.10 |
---|---|
Rconsole 영어로 바꾸기. (0) | 2018.09.10 |
애니메이션(연속된 이미지 처리 ) (0) | 2018.09.08 |
애니메이션(움직이는 바차트) (0) | 2018.09.08 |
애니메이션(카운트 다운) (0) | 2018.09.08 |
#IT #먹방 #전자기기 #일상
#개발 #일상