반응형
통계치를 통해서 전입수가 제일 많은 지역을 나타내 보자
학부공부/데이터마이닝과통계2018. 9. 15. 01:23통계치를 통해서 전입수가 제일 많은 지역을 나타내 보자

통계치를 통해서 데이터를 시각화 해 볼것인데 , wordcloud를 통해서 나타내 볼 것이다 . 그 전에 다음 사이트를 들어가서 통계치를 다운 받아야 하는데 , 다운 받을 때 CSV 파일로 다운 받아야 한다 . 그런데 다운 받아보면 우리가 실습하는 환경과 데이터가 약간 다르기 때문에 파일은 올려 두겠다. --> 우선 통계청 사이트는 다음과 같다 : www.kostat.go.kr 우리는 다음과 같이 출력해 볼 것이다. library(wordcloud)library(RColorBrewer)# wordcloud와 RColorBrewer이 필요하다 # 없다면 install.packages("wordcloud")을 통해서 다운받자. # 아니면 Rstudio 내에서 Packages 탭에 install을 통해서 다운..

학부공부/데이터마이닝과통계2018. 9. 12. 00:04벡터 결합과 recycling ( + Matrix )

벡터결합과 recycling 1. 행이 다른 Vector끼리 결합을 한다면 가능 할까 ?? è 결과론적으로 불가능하다 . 오류가 뜰 것이다. 2. 가능할 때가 있다 à 이 경우가 recycling 이라고 한다. 행의 수가 A 와 B 벡터가 있다고 하자 A는 네개의 공간이고 , B는 2개의 공간 이라고 할 때 이 A와 B를 data.frame으로 합쳐준다고 할 때 , B의 값들이 반복이 되면서 4행까지 채워지고 하나의 Data_frame을 이루게 된다. 3. Recycling은 매트릭스에서도 가능한데 , Vector와는 다르게 저장공간이 다르더라도 recycling이 가능하다. 만약 Cbind로 A

학부공부/데이터마이닝과통계2018. 9. 11. 23:49data_frame 과 class

data_frame은 문자 + 숫자 상관없이 묶어서 Frame 생성 Class : vector , matrix , list , factor , data_frame 클래스는 이렇게 존재한다 . è Vector은 나오지 않는다--> 이 의미는 Class로 Vector을 지정하게 되면 Vector라고 나오는 것이 아니라 , Vector의 하위요소인 Int,Lo,Ch,Double이 나오는 것이다.è 단 여기서 Vector의 하위로써 double 일 경우 numeric이 나온다.è 문자열로 되어 있는 것을 data_frame으로 될 때는 factor로 변환되어서 저장이 된다. 이때 dt를 데이타프레임이라고 가정을 해보자 그리고 vec_on에는 문자열이 저장되어 있는 factor이라고 가정을 해보자. Typeof(..

학부공부/데이터마이닝과통계2018. 9. 11. 23:29Factor

Factor라는 것은 무엇이며 , 어떻게 쓰이는 것일까.우선 Factor은 객체의 성질을 지니며 , 회기 분석에 사용이 된다 범주형 변수로써 dummy (indicator) variable è R에서는 범주변수를 안만들어도 factor를 사용해서 쓸수 있다. 예를 들어 보자 vec_on 일종의 Vector이다. è As.Integer : 정수형으로 확인 할 때 --> 여기서 헷갈리는 점은 , as.Integer로써 factor의 값을 알고 싶다고 싶을 때 해보면 , --> factor하면서 솔팅되어진 값들의 원래 데이터가 있던 자리의 값들이 나오게 되는데 ,--> 이 의미는 Factor함으로써 솔팅된 값들이 나오게 되는것이다 . 물론 중복을 제외하고 이다. 각각의 값이 Integer로 저장이 되어 있을 ..

학부공부/데이터마이닝과통계2018. 9. 10. 08:23$ 연산자와 이름 활용

하다보니 , List와 행렬 ( 매트릭스 ) 의 차이점이 있다는 것을 알았다.List같은 경우에는 어떤 특정 위치의 이름명이 아니라 숫자형태를 띄고 ,행렬은 특정 행이나 열에 변수명이 먼저 오고 뒤로 값들이 존재한다는 것이다. 그래서 List에서는 이 숫자대신에 변수명을 줄 수 있다. 예를 들어서 val1 = c("1","2","3","4")val2 = c("김","인","우")Ex_List2 만약 이름이 없는 List같은 경우 Null 값을 반환한다.--> 왜냐하면 애초에 List같은 경우 name이 없기 때문이다. 행렬에서도 이름을 확인 할 수 있을까 ?? Rownames(행렬) : 행의 이름이 출력된다Colnames(행렬) : 열의 이름이 출력된다 행렬에서도 $를 사용해서 이름을 확인 할 수 있는가..

학부공부/데이터마이닝과통계2018. 9. 10. 08:01List의 indexing

먼저 List 란 요소들을 나열하는 것을 말한다. List 는 다음과 같이 사용한다List ( 요소 , 요소 ) --> 이렇게 하게 되면 하나의 List로써 요소 + 요소 가 들어가져 있는 List가 만들어 진다. 만약 List에서 특정 위치의 요소를 보고 싶다면 어떻게 할까..? List는 전에 배웠던 , Vector 와 행렬과는 조금 다르다List는 이중 [[]] 의 형태를 갖는다.--> List [[특정 하위의 요소 위치 ]] [ 요소 위치 ] List 안에 요소자리에 List가 올 수 있다.이 때 만약 List안에 있는 List의 위치를 알고 싶다면[[[특정 하위 요소 위치 ]]] [ 요소 위치 ]] 를 사용하면 될 것이다.

반응형
image