반응형
데이터 분석 준전문가(adsp) - 데이터 마트
자격증/ADSP2020. 1. 30. 17:39데이터 분석 준전문가(adsp) - 데이터 마트

1. R reshape를 이용한 데이터 마트 개발 가.데이터 마트 - 데이터 웨어하우스와 사용자 사이의 중간층에 위치한 것으로 하나의 주제 또는 하나의 부서 중심의 데이터 웨어하우스라고 할 수 있다. - 데이터 마트 내 대부분의 데이터는 데이터 웨어하우스로부터 복제되지만 , 자체적으로 수집될 수도 있으며 관계형 데이터 베이스나 다차원 데이터 베이스를 이용하여 구축 한다. - CRM ( customer relationship management) 관련 업무 중에서 핵심 - 고객 데이터 마트 구축 - 동일한 데이터 셋을 활용할 경우 , 최신 분석기법들을 이용하면 분석가의 역량에서는 분석 효과가 크게 차이가 나지 않기 때문에 데이터 마트를 어떻게 구축하느냐에 ㄸ라 분석 효과는 크게 차이 난다. 나. 요약변수 ..

데이터 분석 준전문가(adsp) - 데이터 변형
자격증/ADSP2020. 1. 30. 17:04데이터 분석 준전문가(adsp) - 데이터 변형

1. 주요 코드 요인으로 집단 정의 v

데이터 분석 준전문가(adsp) - 데이터 구조와 데이터 프레임 - 2
자격증/ADSP2020. 1. 28. 17:26데이터 분석 준전문가(adsp) - 데이터 구조와 데이터 프레임 - 2

1. 데이터 프레임 - 데이터에서 각각의 변수에 해당하는 열들의 모임으로 R에서 활용하는 코드들은 아래와 같다. 데이터프레임 : data.frame(벡터,벡터,벡터) : 벡터들로 데이터셋 생성 레코드 생성 : new 5 , c(변수3,변수4) --> 데이터셋의 변수1과 변수2의 조건에 만족하는 레코드의 변수3과 변수4만을 조회 데이터 프레임 조회3 dfrm[grep("문자", dfrm$변수1, ignore.case = T ) , c("변수2,변수3") --> 데이터셋의 변수1 내 "문자"가 들어 있는 케이스들의 변수2,변수3 값을 조회 데이터셋 조회 subset(dfrm, select=변수 , subset=변수>조건) --> 데이터셋의 특정변수의 값이 조건에 맞는 변수셋 조회 , subset은 벡터와 리..

데이터 분석 준전문가(adsp) - 데이터 구조와 데이터 프레임 - 1
자격증/ADSP2020. 1. 27. 16:07데이터 분석 준전문가(adsp) - 데이터 구조와 데이터 프레임 - 1

1.벡터 ( Vector ) 가. 벡터들은 동질적이다. - 한 벡터의 모든 원소는 같은 자료형 또는 같은 모드 ( mode ) 를 가진다. 나. 벡터는 위치로 인덱스 된다 - V[2]는 V벡터의 2번째 원소이다 다. 벡터는 인덱스를 통해 여러 개의 원소로 구성된 하위 벡터를 반환할 수 있다. - V[c(2,3)]은 V벡터의 2번째 , 3번째 원소로 구성된 하위벡터이다. 라. 벡터 원소들은 이름을 가질 수 있다. - V length(pi) [1] 1 나. 행렬(Matrix) - R에서는 차원을 가진 벡터로 인식 다. 배열(Arrays) - 행렬에 3차원 또는 n차원까지 확장된 형태 - 주어진 벡터에 더 많은 차원을 부여하여 배열을 생성 > b dim(b)

데이터 분석 준전문가(adsp) - 입력과 출력
자격증/ADSP2020. 1. 23. 15:46데이터 분석 준전문가(adsp) - 입력과 출력

1. 데이터 분석 과정 - 분석자가 분석 목적에 맞는 적절한 분석 방법론을 선택해서 정확한 분석을 통해 얻은 결과를 통찰력을 가지고 해석함으로써 분석 과정을 마치게 된다. - 이렇게 데이터를 분석하기 위해서는 분석자가 분석을 위해 설계된 방향으로 데이터를 정확하게 입력받는 것에서부터 시작될 수 있다. - 그리고 입력된 데이터는 다양한 전처리 작업을 거쳐 분석이 가능한 형태로 재정리 됩니다. 우리는 이것을 데이터 핸들링이라고도 한다. - 또한 분석된 결과를 이해하기 쉽고 잘 해석할 수 있도록 생산하는 부분을 데이터 출력이라고 할 수 있다. 출력된 결과는 보고서의 형태로 정리되어 최종 의사결정자와 고객에게 전달되게 됨으로써 통계분석 과정은 종료된다고 할 수 있다. 2. R에서의 데이터 입력과 출력 - R에서..

데이터 분석 준전문가(adsp) -  R 기초 - 2
자격증/ADSP2020. 1. 22. 17:26데이터 분석 준전문가(adsp) - R 기초 - 2

1.R 기초 중에 기초 출력하기 - 커맨드 프롬프트에 변수나 표현식을 입력 print() : 출력형식을 지정할 필요 없음 , 한번에 하나의 객체만 출력 cat() : 여러 항목을 묶어서 연결된 결과로 출력 , 복합적 데이터 구조 ( 행렬 list 등 ) 를 출력 할 수 없음 변수에 값 할당하기

반응형
image