반응형
데이터 분석 준전문가(adsp) - 데이터 구조와 데이터 프레임 - 1
자격증/ADSP2020. 1. 27. 16:07데이터 분석 준전문가(adsp) - 데이터 구조와 데이터 프레임 - 1

1.벡터 ( Vector ) 가. 벡터들은 동질적이다. - 한 벡터의 모든 원소는 같은 자료형 또는 같은 모드 ( mode ) 를 가진다. 나. 벡터는 위치로 인덱스 된다 - V[2]는 V벡터의 2번째 원소이다 다. 벡터는 인덱스를 통해 여러 개의 원소로 구성된 하위 벡터를 반환할 수 있다. - V[c(2,3)]은 V벡터의 2번째 , 3번째 원소로 구성된 하위벡터이다. 라. 벡터 원소들은 이름을 가질 수 있다. - V length(pi) [1] 1 나. 행렬(Matrix) - R에서는 차원을 가진 벡터로 인식 다. 배열(Arrays) - 행렬에 3차원 또는 n차원까지 확장된 형태 - 주어진 벡터에 더 많은 차원을 부여하여 배열을 생성 > b dim(b)

데이터 분석 준전문가(adsp) - 입력과 출력
자격증/ADSP2020. 1. 23. 15:46데이터 분석 준전문가(adsp) - 입력과 출력

1. 데이터 분석 과정 - 분석자가 분석 목적에 맞는 적절한 분석 방법론을 선택해서 정확한 분석을 통해 얻은 결과를 통찰력을 가지고 해석함으로써 분석 과정을 마치게 된다. - 이렇게 데이터를 분석하기 위해서는 분석자가 분석을 위해 설계된 방향으로 데이터를 정확하게 입력받는 것에서부터 시작될 수 있다. - 그리고 입력된 데이터는 다양한 전처리 작업을 거쳐 분석이 가능한 형태로 재정리 됩니다. 우리는 이것을 데이터 핸들링이라고도 한다. - 또한 분석된 결과를 이해하기 쉽고 잘 해석할 수 있도록 생산하는 부분을 데이터 출력이라고 할 수 있다. 출력된 결과는 보고서의 형태로 정리되어 최종 의사결정자와 고객에게 전달되게 됨으로써 통계분석 과정은 종료된다고 할 수 있다. 2. R에서의 데이터 입력과 출력 - R에서..

데이터 분석 준전문가(adsp) -  R 기초 - 2
자격증/ADSP2020. 1. 22. 17:26데이터 분석 준전문가(adsp) - R 기초 - 2

1.R 기초 중에 기초 출력하기 - 커맨드 프롬프트에 변수나 표현식을 입력 print() : 출력형식을 지정할 필요 없음 , 한번에 하나의 객체만 출력 cat() : 여러 항목을 묶어서 연결된 결과로 출력 , 복합적 데이터 구조 ( 행렬 list 등 ) 를 출력 할 수 없음 변수에 값 할당하기

데이터 분석 준전문가(adsp) - R 기초 - 1
자격증/ADSP2020. 1. 22. 14:49데이터 분석 준전문가(adsp) - R 기초 - 1

1.통계 패키지 R 1) 패키지 ( Package ) 가) 패키지란 - R 함수와 데이터 및 컴파일된 코드의 모임 나 ) 패키지 불러들이기 (1) 하드디스크 - R을 설치하거나 업데이트를 통해 설치 (2) 웹 - 2014년 CRAN 저장소에는 약 5000개의 유용한 패키지가 자동설치 - install. packages( " AID " ) (3) 패키지 도움말 - library ( help = AID ) : 다운로드 된 AID 패키지의 help 다큐먼트를 보여준다. - help ( package = AID ) : 웹을 통해 AID 패키지의 다큐먼트를 보여준다 2) 프로그램과 파일 실행 스크립트로 프로그램밍 된 파일 실행하기 : source ( "파일명 " ) : 오른쪽 방향키 프로그램 파일 : sink (..

데이터 분석 준전문가(adsp) - R 소개
자격증/ADSP2020. 1. 21. 17:04데이터 분석 준전문가(adsp) - R 소개

1. 데이터 분석 도구의 현황 가. R의 탄생 - R은 오픈소스 프로그램으로 통계 , 데이터마이닝과 그래프를 위한 언어이다. - 다양한 최신 통계분석과 마이닝 기능을 제공한다. - 세계적으로 많은 사용자들이 다양한 예제를 공유한다. - 다양한 기능을 지원하는 많은 패키지가 수시로 업데이트 된다. 나. 분석도구의 비교 SAS - 프로그램 비용 : 유로 , 고가 - 설치용량 : 대용량 - 다양한 모듈 지원 및 비용 : 별도구매 - 최근 알고리즘 및 기술반영 : 느림 - 학습자료 입수의 편의성 : 유로 도서 위주 - 질의를 위한 공개 커뮤니티 : NA SPSS - 프로그램 비용 : 유료 , 고가 - 설치용량 : 대용량 - 다양한 모듈 지원 및 비용 : 별도구매 - 최근 알고리즘 및 기술반영 : 다소느림 - 학..

데이터 분석 준전문가(adsp) - 데이터 분석 기법의 이해
자격증/ADSP2020. 1. 21. 15:52데이터 분석 준전문가(adsp) - 데이터 분석 기법의 이해

1.데이터 처리 가. 개요 - 데이터분석은 통계에 기반을 두고 있지만 , 통계지식과 복잡한 가정이 상대적으로 적은 실용적인 분야이다. 나. 활용 - 대기업은 데이터웨어하우스 ( DW ) 와 데이터마트 ( DM ) 를 통해 분석 데이터를 가져와서 사용한다. - 신규 시스템이나 DW에 포함되지 못한 자료의 경우 , 기존 운영시스템 ( Legacy ) 이나 스테이징영역 (staging area) 과 ODS ( Operation Data Store ) 에서 데이터를 가져와서 DW에서 가져온 내용과 결합하여 활용할 수 있다. - 하지만 운영시스템에 직접 접근해 데이터를 활용하는 것은 매우 위험한 일이므로 거의 이루어지지 않고 있으며 , 스테이징 영역 ( Staging Area ) 의 데이터는 운영시스템에서 임시로..

반응형
image