반응형
특정 버스의 버스경로에서 특정 정류장 위치 뽑기.
학부공부/데이터마이닝과통계2018. 12. 18. 14:56특정 버스의 버스경로에서 특정 정류장 위치 뽑기.

API를 사용하여서 , 실시간 버스의 위치를 뽑아오는것 까지는 해보았다. 그런데 , 버스가 아니라 , 정류장의 위치를 뽑아 낼 수도 있을까..? 그래서 해보았다. 코드를 통해서 확인해 보자. 일단 , 지도로 위치를 markup해줄것이기 때문에 , 특정 라이브러리를 로딩시켜줘야 한다.library(XML)library(ggmap) 여기서 url을 보게 되면 공공데이터 포털 사이트에서 인증 받은 API 키가 포함되어 있다.공공데이터 포털사이트 가서 자신의 API Key를 받아주자. 그리고 , 뒤에 보게 되면 strSrch = 146 은 146번의 버스를 의미한다. url

조건부 확률 , 곱의 법칙 , 독립 사상 , 베이즈 정리 , 마르코프 결정 과정 , 베이즈 네트워크
학부공부/데이터마이닝과통계2018. 12. 6. 20:52조건부 확률 , 곱의 법칙 , 독립 사상 , 베이즈 정리 , 마르코프 결정 과정 , 베이즈 네트워크

조건부 확률 è 어떤 조건 (B) 이 주어진 상태에서 특정 사건(A)이 발생할 확률 è 모든 원소의 발생확률이 동일하다면 다음과 같이 남학생과 여학생 , 그 남학생과 여학생에 따른 문과출신과 이과출신이 존재한다. è 한 학생이 문과출신일 때 , 그 학생이 여학생일 조건부 확률 è 한 학생이 여학생일 때 , 그 학생이 문과출신일 조건부 확률 곱의 법칙 (multiplicative law) è 두 사상 A와B가 동시에 발생할 확률 독립 사상 (independent events) è 표본공간을 이루고 있는 사건 A와B에 대하여 두 사건 A와 B가 서로 독립이면 다음이 성립하게 된다 . è 즉 , P(B|A)에서 조건으로 주어진 사건 A가 사건 B에 아무런 영향을 주지 못하므로 , 사건 A와 B는 서로 독립인 ..

데이터셋을 활용하여서 회귀분석을 해보자.
학부공부/데이터마이닝과통계2018. 12. 3. 06:38데이터셋을 활용하여서 회귀분석을 해보자.

오늘은 기존에 알고 있던 , mtcars ( 기존 R에 내장되어 있는 데이터셋 ) 말고 , 새로운 데이터셋을 구해서 회귀분석을 다뤄보겠다. 데이터셋을 다루는 사이트는 굉장히 많다 . 그런데 , 자동차 특정 정보를 포함하는 데이터셋을 찾기에는 어려웠다. 다음은 내가 찾은 데이터셋 사이트중 괜찮은 곳 들을 정리해 보았다. https://www.kaggle.com/ --> 데이터셋 사이트 https://archive.ics.uci.edu/ml/datasets.html --> 데이터셋 사이트 https://www.teoalida.com/cardatabase/ --> cardatabase 전문사이트 내가 사용할 곳은 cardatabase전문 사이트이다. 자동차 정보가 내가 원하는 곳이 있었기 때문이다. 사이트를 ..

R패키지의 데이터셋을 다뤄보기 ( with mtcars )
학부공부/데이터마이닝과통계2018. 11. 30. 01:39R패키지의 데이터셋을 다뤄보기 ( with mtcars )

오늘은 R패키지에 있는 "mtcars"데이터를 이용하여서 , 자동차 중량(wt) 대비 연비(wt)의 선점도 (scatter diagram chart)를 그려보겠다.R에 내장된 datasets : 내장된 데이터 셋을 불러오는 방법과 현재 설치된 패키지가 가지고 있는 데이터 셋을 조회하는 방법에 대한 코드를살펴본다.또한 410개의 패키지에서 제공하는 3140개의 데이터 셋에 대한 패키지 명 , 데이터 셋 명칭 , 데이터 셋 주제 (Topic) , 데이터 행 (row)의 수 데이터 열 (Column)의 수에 대한 정보가 포함되어 있는 파일을 알아 보겠다. http://www.public.iastate.edu/~hofmann/data_in_r_sortable.html https://vincentarelbundo..

통계학의 개념
학부공부/데이터마이닝과통계2018. 11. 27. 10:06통계학의 개념

통계학이란? 1. 불확실한 상황 하에서 데이터에 근거하여 과학적인 의사결정을 하기 위한 이론과 방법의 체계 통계학의 활용분야 1. 데이터의 수집 , 분류 , 표현 , 분석 , 추론 , 해석 2. 통계학자의 역할 è 필요한 데이터의 형태 è 데이터를 수집하는 방법 è 문제에 대한 최선의 답을 구하기 위한 분석방법 통계학의 연구분야 1. 통계적 이론과 방법론 개발 2. 통계적 방법론 응용 모집단과 표본 1. 모집단 ( population ) è 통계분석의 연구대상이 되는 모든 개체들의 집합 , 올바른 의사결정을 하기 위해 관심을 갖고 연구해야 할 대상 Ex ) 총학 선거 2명 = 모집단 2. 모수 ( parameter ) è 모집단의 특성을 나타내는 수치이며 , 올바른 의사결정을 위해 특별히 관심을 갖는 모..

다양한 확률분포
학부공부/데이터마이닝과통계2018. 11. 24. 17:18다양한 확률분포

오늘은 다양한 확률분포에 대해서 다뤄보고자 한다. 정리해 두면 나중에 볼 것 같아서 정리해 본다. 연속형 확률분포에는 다음과 같은 것들이 있다. 1. 정규분포 ( normal distribution ) : norm()2. 균등분포 ( uniform distribution ) : unif()3. 지수분포 ( exponential distribution ) : exp()4. T – 분포 ( T – distribution ) : t()5. F – 분포 ( F – distribution ) : f()6. 카이제곱분포 ( chisq – distribution ) : chisq()7. … 등이 있다. 정규분포는 추정과 검정을 하는 추정통계학 , 회귀분석과 같은 모형 적합시 근간이 되는 확률 분포이다. 우리의 일상 ..

반응형
image