반응형
데이터 분석 준전문가(adsp) - 데이터 가공
자격증/ADSP2020. 1. 31. 23:54데이터 분석 준전문가(adsp) - 데이터 가공

1. Data Exploration 가. 개요 - 데이터 분석을 위한 구성된 데이터의 변수들의 상태를 파악한다. 나. 종류 1) head(데이터셋) , tail(데이터셋) - 시작 또는 마지막 6개 record만 조회하는 함수 2) summary(데이터셋) 가) 수치형변수 : 최대값 , 최소값 , 평균 , 1사분위수 , 2사분위수(중앙값) , 3사분위수 나) 명목형변수 : 명목값 , 데이터 개수 2. 변수 중요도 가. 개요 - 변수 선택법과 유사한 개념으로 모형을 생성하여 사용된 변수의 중요도를 살피는 과정이다. 나. 종류 1) klaR 패키지 - 특정 변수가 주어졌을 때 클래스가 어떻게 분류되는지에 대한 에러율을 계산해주고 , 그래픽으로 결과를 보여주는 기능을 한다. - greedy.wilks() : ..

데이터 분석 준전문가(adsp) - 데이터 마트
자격증/ADSP2020. 1. 30. 17:39데이터 분석 준전문가(adsp) - 데이터 마트

1. R reshape를 이용한 데이터 마트 개발 가.데이터 마트 - 데이터 웨어하우스와 사용자 사이의 중간층에 위치한 것으로 하나의 주제 또는 하나의 부서 중심의 데이터 웨어하우스라고 할 수 있다. - 데이터 마트 내 대부분의 데이터는 데이터 웨어하우스로부터 복제되지만 , 자체적으로 수집될 수도 있으며 관계형 데이터 베이스나 다차원 데이터 베이스를 이용하여 구축 한다. - CRM ( customer relationship management) 관련 업무 중에서 핵심 - 고객 데이터 마트 구축 - 동일한 데이터 셋을 활용할 경우 , 최신 분석기법들을 이용하면 분석가의 역량에서는 분석 효과가 크게 차이가 나지 않기 때문에 데이터 마트를 어떻게 구축하느냐에 ㄸ라 분석 효과는 크게 차이 난다. 나. 요약변수 ..

데이터 분석 준전문가(adsp) - 데이터 변형
자격증/ADSP2020. 1. 30. 17:04데이터 분석 준전문가(adsp) - 데이터 변형

1. 주요 코드 요인으로 집단 정의 v

데이터 분석 준전문가(adsp) - 데이터 구조와 데이터 프레임 - 2
자격증/ADSP2020. 1. 28. 17:26데이터 분석 준전문가(adsp) - 데이터 구조와 데이터 프레임 - 2

1. 데이터 프레임 - 데이터에서 각각의 변수에 해당하는 열들의 모임으로 R에서 활용하는 코드들은 아래와 같다. 데이터프레임 : data.frame(벡터,벡터,벡터) : 벡터들로 데이터셋 생성 레코드 생성 : new 5 , c(변수3,변수4) --> 데이터셋의 변수1과 변수2의 조건에 만족하는 레코드의 변수3과 변수4만을 조회 데이터 프레임 조회3 dfrm[grep("문자", dfrm$변수1, ignore.case = T ) , c("변수2,변수3") --> 데이터셋의 변수1 내 "문자"가 들어 있는 케이스들의 변수2,변수3 값을 조회 데이터셋 조회 subset(dfrm, select=변수 , subset=변수>조건) --> 데이터셋의 특정변수의 값이 조건에 맞는 변수셋 조회 , subset은 벡터와 리..

데이터 분석 준전문가(adsp) - 데이터 구조와 데이터 프레임 - 1
자격증/ADSP2020. 1. 27. 16:07데이터 분석 준전문가(adsp) - 데이터 구조와 데이터 프레임 - 1

1.벡터 ( Vector ) 가. 벡터들은 동질적이다. - 한 벡터의 모든 원소는 같은 자료형 또는 같은 모드 ( mode ) 를 가진다. 나. 벡터는 위치로 인덱스 된다 - V[2]는 V벡터의 2번째 원소이다 다. 벡터는 인덱스를 통해 여러 개의 원소로 구성된 하위 벡터를 반환할 수 있다. - V[c(2,3)]은 V벡터의 2번째 , 3번째 원소로 구성된 하위벡터이다. 라. 벡터 원소들은 이름을 가질 수 있다. - V length(pi) [1] 1 나. 행렬(Matrix) - R에서는 차원을 가진 벡터로 인식 다. 배열(Arrays) - 행렬에 3차원 또는 n차원까지 확장된 형태 - 주어진 벡터에 더 많은 차원을 부여하여 배열을 생성 > b dim(b)

반응형
image