1. 다차원척도법 ( Multidimensional Scaling )
- 객체간 근접성 ( Proximity ) 을 시각화하는 통계기법이다.
- 군집분석과 같이 개체들을 대상으로 변수들을 측정한 후에 개체들 사이의 유사성 / 비유사성을 측정하여 개체들을 2차원 공간상에 점으로 표현하는 분석방법이다.
- 개체들을 2차원 또는 3차원 공간상에 점으로 표현하여 개체들 사이의 집단화를 시각적으로 표현하는 분석방법이다.
2. 다차원척도법 목적
- 데이터 속에 잠재해 있는 패턴(pattern) , 구조를 찾아낸다
- 그 구조를 소수 차원의 공간에 기하학적으로 표현한다.
- 데이터 축소 (Data Reduction) 의 목적으로 다차원척도법을 이용한다. 즉 , 데이터에 포함되는 정보를 끄집어내기 위해서 다차원척도법을 탐색수단으로써 사용한다.
- 다차원척도법에 의해서 얻은 결과를 , 데이터가 만들어진 현상이나 과정에 고유의 구조로서 의미를 부여한다.
3. 다차원척도법 방법
- 개체들의 거리 계산에는 유클리드 거리행렬을 활용한다.
- 관측대상들의 상대적 거리의 정확도를 높이기 위해 적합 정도를 스트레스 값 ( Stress Value ) 으로 나타낸다.
- 각 개체들을 공간상에 표현하기 위한 방법은 부적합도 기준으로 STRESS 나 S-STRESS를 사용한다.
- 최적모형의 적합은 부적합도를 최소로 하는 반복알고리즘을 이용하며 , 이 값이 일정 수준 이하가 될 때 최종적으로 적합된 모형으로 제시한다.
- STRESS 와 적합도 수준 M은 개체들을 공간상에 표현하기 위한 방법으로 STRESS나 S-STRESS를 부적합도 기준으로 사용한다
- 최적모형의 적합은 부적합도를 최소로 하는 방법으로 일정 수준이하로 될 때까지 반복해서 수행한다.
STRESS 0 : 완벽
STRESS 0.05 이내 : 매우 좋은
STRESS 0.05 ~ 0.10 : 만족
STRESS 0.10 ~ 0.15 : 보통
STRESS 0.15 이상 : 나쁨
4. 다차원척도법 종류
가. 계량적 MDS ( Metric MDS )
- 데이터가 구간척도나 비율척도인 경우 활용한다.
나. 비계량적 MDS ( nonmetric MDS )
- 데이터가 순서척도인 경우 활용한다. 개체들간의 거리가 순서로 주어진 경우에는 순서척도를 거리의 속성과 같도록 변환 ( monotone transformation ) 하여 거리를 생성한 후 적용한다.
'자격증 > ADSP' 카테고리의 다른 글
데이터 분석 준전문가(adsp) - 정형 데이터 마이닝 (0) | 2020.02.11 |
---|---|
데이터 분석 준전문가(adsp) - 주성분 분석 (2) | 2020.02.11 |
데이터 분석 준전문가(adsp) - 시계열 분석 (0) | 2020.02.08 |
데이터 분석 준전문가(adsp) - 회귀분석 (0) | 2020.02.08 |
데이터 분석 준전문가(adsp) - 기초 통계분석 (0) | 2020.02.07 |
#IT #먹방 #전자기기 #일상
#개발 #일상