반응형
데이터 분석 준전문가(adsp) - 정형 데이터 마이닝
자격증/ADSP2020. 2. 11. 15:36데이터 분석 준전문가(adsp) - 정형 데이터 마이닝

1. 데이터마이닝 가. 개요 - 데이터마이닝은 대용량 데이터에서 의미있는 패턴을 파악하거나 예측하여 의사결정에 활용하는 방법이다. 나. 통계분석과의 차이점 - 통계분석은 가설이나 가정에 따른 분석이나 검증을 하지만 데이터마이닝은 다양한 수리 알고리즘을 이용해 데이터베이스의 데이터로부터 의미있는 정보를 찾아내는 방법을 통칭한다. 다. 종류 정보를 찾는 방법론에 따른 종류 - 인공지능 ( Artificial Intelligence ) - 의사결정나무 ( Decision Tree ) - K - 평균군집화 ( K-means Clustering ) - 연관분석 ( Association Rule ) - 회귀분석 ( Regression ) - 로짓분석 ( Logit Analysis ) - 최근접이웃 ( Nearest..

데이터 분석 준전문가(adsp) - 주성분 분석
자격증/ADSP2020. 2. 11. 15:19데이터 분석 준전문가(adsp) - 주성분 분석

1. 주성분분석 ( Principal Component Analysis ) - 여러 변수들의 변량을 '주성분(Principal Component)' 이라는 서로 상관성이 높은 변수들의 선형결합으로 만들어 기존의 상관성이 높은 변수들을 요약,축소하는 기법이다. - 첫 번째 주성분으로 전체 변동을 가장 많이 설명할 수 있도록하고 , 두 번째 주성분으로는 첫 번째 주성분과는 상관성이 없어서(낮아서) 첫 번째 주성분이 설명하지 못하는 나머지 변동을 정보의 손실 없이 가장 많이 설명할 수 있도록 변수들의 선형조합을 만든다. 2. 주성분분석의 목적 - 여러 변수들 간에 내재하는 상관관계 , 연관성을 이용해 소수의 주성분으로 차원을 축소함으로써 데이터를 이해하기 쉽고 관리하기 쉽게 해준다. - 다중공선성이 존재하는 ..

데이터 분석 준전문가(adsp) - 다차원척도법
자격증/ADSP2020. 2. 10. 23:52데이터 분석 준전문가(adsp) - 다차원척도법

1. 다차원척도법 ( Multidimensional Scaling ) - 객체간 근접성 ( Proximity ) 을 시각화하는 통계기법이다. - 군집분석과 같이 개체들을 대상으로 변수들을 측정한 후에 개체들 사이의 유사성 / 비유사성을 측정하여 개체들을 2차원 공간상에 점으로 표현하는 분석방법이다. - 개체들을 2차원 또는 3차원 공간상에 점으로 표현하여 개체들 사이의 집단화를 시각적으로 표현하는 분석방법이다. 2. 다차원척도법 목적 - 데이터 속에 잠재해 있는 패턴(pattern) , 구조를 찾아낸다 - 그 구조를 소수 차원의 공간에 기하학적으로 표현한다. - 데이터 축소 (Data Reduction) 의 목적으로 다차원척도법을 이용한다. 즉 , 데이터에 포함되는 정보를 끄집어내기 위해서 다차원척도법을..

데이터 분석 준전문가(adsp) - 시계열 분석
자격증/ADSP2020. 2. 8. 20:24데이터 분석 준전문가(adsp) - 시계열 분석

1. 시계열 자료 - 시간의 흐름에 따라 관찰된 값들을 시계열 자료라 한다. - 시계열 데이터의 분석을 통해 미래의 값을 예측하고 경향 , 주기 , 계절성 등을 파악하여 활용한다. 나. 시계열 자료의 종류 1) 비정상성 시계열 자료 - 시계열 분석을 실시할 때 다루기 어려운 자료로 대부분의 시계열자료가 이에 해당한다. 2) 정상성 시계열 자료 - 비정상 시계열을 핸들링해 다루기 쉬운 시계열 자료로 변환한 자료이다. 2. 정상성 가. 평균이 일정할 경우 - 모든 시점에 대해 일정한 평균을 가진다. - 평균이 일정하지 않은 시계열은 차분(difference)을 통해 정상화할 수 있다. 나.분산이 일정 - 분산도 시점에 의존하지 않고 일정해야 한다. - 분산이 일정하지 않을 경우 변환(Transformatio..

데이터 분석 준전문가(adsp) - 회귀분석
자격증/ADSP2020. 2. 8. 00:31데이터 분석 준전문가(adsp) - 회귀분석

1.회귀분석의 개요 가. 회귀분석의 정의 - 하나 그 이상의 독립변수들이 종속변수에 미치는 영향을 추정할 수 있는 통계기법이다. - 변수들 사이의 인과관계를 밝히고 모형을 적합하여 관심있는 변수를 예측하거나 추론하기 위한 분석방법이다. - 독립변수의 개수가 하나이면 단순선형외귀분석 , 독립변수의 개수가 두 개 이상이면 다중선형 회귀분석으로 분석할 수 있다. 나. 회귀분석의 변수 - 영향을 받는 변수 ( y ) : 반응변수 ( response variable ) , 종속변수 (dependent variable) , 결과변수 (outcome variable) - 영향을 주는 변수 ( x ) : 설명변수 ( explanatory variable ) , 독립변수 ( independent variable ) , ..

데이터 분석 준전문가(adsp) - 기초 통계분석
자격증/ADSP2020. 2. 7. 13:39데이터 분석 준전문가(adsp) - 기초 통계분석

1. 기술통계 ( Descriptive Statistics ) 가. 기술통계의 정의 - 자료의 특성을 표,그림,통계량 등을 사용하여 쉽게 파악할 수 있도록 정리/요약하는 것이다. - 자료를 요약하는 기초적 통계를 의미한다. - 데이터 분석에 앞서 데이터의 대략적인 통계적 수치를 계싼해봄으로써 데이터에 대한 대략적인 이해와 앞으로 분석에 대한 통찰력을 얻기에 유리하다. 3) 분포의 형태에 관한 측도 가) 왜도 - 분포의 비대칭정도를 나타내는 측도이다. - m3 > 0 : 오른쪽으로 긴 꼬리를 갖는 분포 - m3 = 0 : 좌우가 대칭인 분포 - m3 0 : 표준정규분포보다 더 뾰족함 - m..

반응형
image