자격증/ADSP

데이터 분석 준전문가(adsp) - 다차원척도법

IT grow. 2020. 2. 10. 23:52
반응형

1. 다차원척도법 ( Multidimensional Scaling ) 

 

- 객체간 근접성 ( Proximity ) 을 시각화하는 통계기법이다.

- 군집분석과 같이 개체들을 대상으로 변수들을 측정한 후에 개체들 사이의 유사성 / 비유사성을 측정하여 개체들을 2차원 공간상에 점으로 표현하는 분석방법이다.

- 개체들을 2차원 또는 3차원 공간상에 점으로 표현하여 개체들 사이의 집단화를 시각적으로 표현하는 분석방법이다.

 

 

 

2. 다차원척도법 목적 

 

- 데이터 속에 잠재해 있는 패턴(pattern) , 구조를 찾아낸다

- 그 구조를 소수 차원의 공간에 기하학적으로 표현한다.

- 데이터 축소 (Data Reduction) 의 목적으로 다차원척도법을 이용한다. 즉 , 데이터에 포함되는 정보를 끄집어내기 위해서 다차원척도법을 탐색수단으로써 사용한다.

- 다차원척도법에 의해서 얻은 결과를 , 데이터가 만들어진 현상이나 과정에 고유의 구조로서 의미를 부여한다.

 

 

3. 다차원척도법 방법

 

- 개체들의 거리 계산에는 유클리드 거리행렬을 활용한다.

- 관측대상들의 상대적 거리의 정확도를 높이기 위해 적합 정도를 스트레스 값 ( Stress Value ) 으로 나타낸다. 

- 각 개체들을 공간상에 표현하기 위한 방법은 부적합도 기준으로 STRESS 나 S-STRESS를 사용한다.

- 최적모형의 적합은 부적합도를 최소로 하는 반복알고리즘을 이용하며 , 이 값이 일정 수준 이하가 될 때 최종적으로 적합된 모형으로 제시한다.

- STRESS 와 적합도 수준 M은 개체들을 공간상에 표현하기 위한 방법으로 STRESS나 S-STRESS를 부적합도 기준으로 사용한다 

- 최적모형의 적합은 부적합도를 최소로 하는 방법으로 일정 수준이하로 될 때까지 반복해서 수행한다.

 

 

STRESS 0 : 완벽 

STRESS 0.05 이내 : 매우 좋은 

STRESS 0.05 ~ 0.10 : 만족 

STRESS 0.10 ~ 0.15 : 보통 

STRESS 0.15 이상 : 나쁨 

 

 

4. 다차원척도법 종류 

 

가. 계량적 MDS ( Metric MDS ) 

- 데이터가 구간척도나 비율척도인 경우 활용한다. 

 

 

나. 비계량적 MDS ( nonmetric MDS ) 

- 데이터가 순서척도인 경우 활용한다. 개체들간의 거리가 순서로 주어진 경우에는 순서척도를 거리의 속성과 같도록 변환 ( monotone transformation ) 하여 거리를 생성한 후 적용한다.

 

 

 

반응형