반응형
데이터 분석 준전문가(adsp) - 기초 통계분석
자격증/ADSP2020. 2. 7. 13:39데이터 분석 준전문가(adsp) - 기초 통계분석

1. 기술통계 ( Descriptive Statistics ) 가. 기술통계의 정의 - 자료의 특성을 표,그림,통계량 등을 사용하여 쉽게 파악할 수 있도록 정리/요약하는 것이다. - 자료를 요약하는 기초적 통계를 의미한다. - 데이터 분석에 앞서 데이터의 대략적인 통계적 수치를 계싼해봄으로써 데이터에 대한 대략적인 이해와 앞으로 분석에 대한 통찰력을 얻기에 유리하다. 3) 분포의 형태에 관한 측도 가) 왜도 - 분포의 비대칭정도를 나타내는 측도이다. - m3 > 0 : 오른쪽으로 긴 꼬리를 갖는 분포 - m3 = 0 : 좌우가 대칭인 분포 - m3 0 : 표준정규분포보다 더 뾰족함 - m..

Python_협업필터링_알고리즘3
졸업작품_preparing..../python_작업2019. 1. 1. 18:15Python_협업필터링_알고리즘3

협업필터링 알고리즘 연습3(Collaborative filtering _ algorithm)저번에 사용한 유클리디안 거리공식을 활용한 유사도 측정에는 문제점이 있다. 특정인물의 점수기준이 극단적으로 너무 낮거나 높다면 제대로 된 결과를 도출해낼 수 없는 것이다. 예를 들어 나에게 영화를 평가할 때 일정 기준이 있어 , 기대를 충족하지 못하면 모두 0점을 주고 , 아니면 모두 만점을 주면 전체 데이터를 해치는 결과를 낳는다. 이것을 보완한 것이 Correlation_analysis(상관분석)이다. 상관분석은 두 변수간의 선형적 관계에 대한 분석이다. 쉽게 말해서 점수간 관계에 따라 점을 찍은 후 그 점이 분포한 모양에 따라 상관관계를 도출해내는 것이다 . 아래 그림과 같이 두 변인 x,y에 대해 x가 변화..

반응형
image