통계학이란?
1. 불확실한 상황 하에서 데이터에 근거하여 과학적인 의사결정을 하기 위한 이론과 방법의 체계
통계학의 활용분야
1. 데이터의 수집 , 분류 , 표현 , 분석 , 추론 , 해석
2. 통계학자의 역할
è 필요한 데이터의 형태
è 데이터를 수집하는 방법
è 문제에 대한 최선의 답을 구하기 위한 분석방법
통계학의 연구분야
1. 통계적 이론과 방법론 개발
2. 통계적 방법론 응용
모집단과 표본
1. 모집단 ( population )
è 통계분석의 연구대상이 되는 모든 개체들의 집합 , 올바른 의사결정을 하기 위해 관심을 갖고 연구해야 할 대상
Ex ) 총학 선거 2명 = 모집단
2. 모수 ( parameter )
è 모집단의 특성을 나타내는 수치이며 , 올바른 의사결정을 위해 특별히 관심을 갖는 모수만이 연구의 대상이 된다
Ex ) 평균 , 분산 , 표준편차 , 비율
3. 표본 ( Sample )
è 모집단의 특성을 파악하기 위해 모집단으로부터 일정한 규칙에 의해 추출한 모집단의 부분 집합
통계적 추론 ( inference )
è 모집단의 특성 ( 평균 , 분산 , 비율 등 ) 을 추측하는 것
è 추정 , 가설검정
통계량 ( statistic )
è 모집단의 특성(평균,분산,비율 등)을 추측하기 위해 사용하는 표본의 함수
추정량 ( estimator )
è 모수를 추정하는데 , 사용하는 통계량 , 표본평균 , 표본분산 , 표본비율 등이 있다.
샘플링의 개념
1. 샘플링 ( sampling )
è 모집단에 대한 올바른 의사결정을 내리기 위해 모집단으로부터 표본을 추출하는 일련의 과정
샘플링의 필요성
1. 표본조사 ( sample survey )
è 모집단에서 표본을 추출[김인1] 하는 샘플링에 의한 조사 방식
2. 샘플링의 필요성
è 현실적 제약
è 비용 절감
è 시간 절약
è 품질 측면
샘플링 방식
1. 확률표본 (random sample)
è 모집단으로부터 랜덤하게 샘플링하여 독립적이고 동일한 분포를 따르도록 형성된 표본
샘플링과 오차
1. 오차 : 모수의 참값과 측정값과의 차이
2. 오차의 유형 : x = u + s + r + m
è 측정오차 : 측정계기의 부정확 , 즉정기술 부족
è 분석오차 : 분석장비의 부정확 , 분석기술 부족
è 샘플링오차 : 치우친 샘플링
è 축분오차 : 큰 표본에서 측정용 표본을 샘플링할 때 치우짐
3. 오차의 검토
è 신뢰성 ( reliability )
è 정밀도 ( precision )
è 정확성 ( accuracy )
데이터의 정류
1. 데이터 척도의 유형
기술통계와 추측통계
1. 통계학의 구성 체계
통계적 의사결정 절차
'학부공부 > 데이터마이닝과통계' 카테고리의 다른 글
데이터셋을 활용하여서 회귀분석을 해보자. (0) | 2018.12.03 |
---|---|
R패키지의 데이터셋을 다뤄보기 ( with mtcars ) (0) | 2018.11.30 |
다양한 확률분포 (0) | 2018.11.24 |
구글서칭결과크롤링+CSV파일저장시키기 (3) | 2018.11.19 |
Corpus --> VCorpus (2) | 2018.11.18 |
#IT #먹방 #전자기기 #일상
#개발 #일상