통계치를 통해서 전입수가 제일 많은 지역을 나타내 보자학부공부/데이터마이닝과통계2018. 9. 15. 01:23
Table of Contents
반응형
통계치를 통해서 데이터를 시각화 해 볼것인데 ,
wordcloud를 통해서 나타내 볼 것이다 .
그 전에 다음 사이트를 들어가서 통계치를 다운 받아야 하는데 ,
다운 받을 때 CSV 파일로 다운 받아야 한다 .
그런데 다운 받아보면 우리가 실습하는 환경과 데이터가 약간 다르기 때문에
파일은 올려 두겠다.
--> 우선 통계청 사이트는 다음과 같다 : www.kostat.go.kr
우리는 다음과 같이 출력해 볼 것이다.
library(wordcloud)library(RColorBrewer)# wordcloud와 RColorBrewer이 필요하다# 없다면 install.packages("wordcloud")을 통해서 다운받자.# 아니면 Rstudio 내에서 Packages 탭에 install을 통해서 다운 받아도 된다 .pal3 <- brewer.pal(8,"Dark2")# 팔레트 설정data1 <- read.csv(file.choose(), header = T)# csv파일을 선택해서 읽어온다head(data1)# 데이터 세트의 앞부분 읽어오기data2 <- data1[data1$행정구역.시군구.별 !="전국",]# 전국을 제외한 데이터 불러오기head(data2)# 데이터 세트의 앞 부분 읽어오기x <- grep("구$",data2$행정구역.시군구.별)# oo구 와 같이 '구'로 끝나는 지역명data3 <- data2[-c(x),]head(data3)# '구'단위 지역의 행에 대한 데이터 제외data4 <- data3[data3$순이동.명>0,]# 순이동.명 이 0 보다 큰 값을 data4에 저장시킨다 .# 이 의미는 이동 자체가 있는 것을 걸른다.word1 <- data4$행정구역.시군구.별# 행정구역,시군구,별을 가져오는데 지역을 의미한다.frequency <- data4$순이동.명# 순이동 하는 통계치를 frequency에 저장을 시킨다.wordcloud(word1,frequency,colors = pal3)# wordcloud를 사용해서 시각화를 해주는데 , 지역 , 빈도 , color지정
반응형
'학부공부 > 데이터마이닝과통계' 카테고리의 다른 글
대통령 연설문 텍스트마이닝 해보기 (0) | 2018.09.18 |
---|---|
Global Environment clear in R (0) | 2018.09.18 |
벡터 결합과 recycling ( + Matrix ) (0) | 2018.09.12 |
data_frame 과 class (0) | 2018.09.11 |
Factor (0) | 2018.09.11 |
@IT grow. :: IT grow.
#IT #먹방 #전자기기 #일상
#개발 #일상