1.R 기초 중에 기초 출력하기 - 커맨드 프롬프트에 변수나 표현식을 입력 print() : 출력형식을 지정할 필요 없음 , 한번에 하나의 객체만 출력 cat() : 여러 항목을 묶어서 연결된 결과로 출력 , 복합적 데이터 구조 ( 행렬 list 등 ) 를 출력 할 수 없음 변수에 값 할당하기
1.통계 패키지 R 1) 패키지 ( Package ) 가) 패키지란 - R 함수와 데이터 및 컴파일된 코드의 모임 나 ) 패키지 불러들이기 (1) 하드디스크 - R을 설치하거나 업데이트를 통해 설치 (2) 웹 - 2014년 CRAN 저장소에는 약 5000개의 유용한 패키지가 자동설치 - install. packages( " AID " ) (3) 패키지 도움말 - library ( help = AID ) : 다운로드 된 AID 패키지의 help 다큐먼트를 보여준다. - help ( package = AID ) : 웹을 통해 AID 패키지의 다큐먼트를 보여준다 2) 프로그램과 파일 실행 스크립트로 프로그램밍 된 파일 실행하기 : source ( "파일명 " ) : 오른쪽 방향키 프로그램 파일 : sink (..
1. 데이터 분석 도구의 현황 가. R의 탄생 - R은 오픈소스 프로그램으로 통계 , 데이터마이닝과 그래프를 위한 언어이다. - 다양한 최신 통계분석과 마이닝 기능을 제공한다. - 세계적으로 많은 사용자들이 다양한 예제를 공유한다. - 다양한 기능을 지원하는 많은 패키지가 수시로 업데이트 된다. 나. 분석도구의 비교 SAS - 프로그램 비용 : 유로 , 고가 - 설치용량 : 대용량 - 다양한 모듈 지원 및 비용 : 별도구매 - 최근 알고리즘 및 기술반영 : 느림 - 학습자료 입수의 편의성 : 유로 도서 위주 - 질의를 위한 공개 커뮤니티 : NA SPSS - 프로그램 비용 : 유료 , 고가 - 설치용량 : 대용량 - 다양한 모듈 지원 및 비용 : 별도구매 - 최근 알고리즘 및 기술반영 : 다소느림 - 학..
1.데이터 처리 가. 개요 - 데이터분석은 통계에 기반을 두고 있지만 , 통계지식과 복잡한 가정이 상대적으로 적은 실용적인 분야이다. 나. 활용 - 대기업은 데이터웨어하우스 ( DW ) 와 데이터마트 ( DM ) 를 통해 분석 데이터를 가져와서 사용한다. - 신규 시스템이나 DW에 포함되지 못한 자료의 경우 , 기존 운영시스템 ( Legacy ) 이나 스테이징영역 (staging area) 과 ODS ( Operation Data Store ) 에서 데이터를 가져와서 DW에서 가져온 내용과 결합하여 활용할 수 있다. - 하지만 운영시스템에 직접 접근해 데이터를 활용하는 것은 매우 위험한 일이므로 거의 이루어지지 않고 있으며 , 스테이징 영역 ( Staging Area ) 의 데이터는 운영시스템에서 임시로..
1. 거버넌스 체계 가.개요 - 기업에서 데이터를 이용한 의사결정이 강조될수록 데이터 분석과 활용을 위한 체계적인 관리가 중요해진다. 단순히 대용량 데이터를 수집,축적하는 것보다는 어떤 목적으로 어떤 데이터를 어떻게 분석에 활용할 것인가가 더욱 중요하기 때문이다. 그리고 조직 내 분석 관리체계를 수립해야 하는 이유는 데이터 분석을 기업의 문화로 정착하고 데이터 분석업무를 지속적으로 고도화하기 위해서이다. 나. 구성요소 - 마스터 플랜 수립 시점에서 데이터 분석의 지속적인 적용과 확산을 위한 거버넌스 체계는 분석 기획 및 관리를 수행하는 조직 ( Organization ) , 과제 기획 및 운영 프로세스 ( Process ) , 분석 관련 시스템 ( System ) , 데이터 ( Data ) , 분석 관련..
1.분석 마스터 플랜 수립 프레임 워크 가.마스터 플랜 수립 개요 - 데이터 기반 구축을 위해서 분석 과제를 대상으로 전략적 중요도 , 비즈니스 성과 및 ROI , 분석 과제의 실행 용이성 등 다양한 기준을 고려해 적용 우선순위를 설정한다. - 업무내재화 적용 수준 , 분석데이터 적용 수준, 기술적용 수준 등 분석 적용 범위 및 방식에 대해서 종합적으로 고려하여 데이터 분석 구현을 위한 로드맵을 수립해야 한다. 나.수행 과제 도출 및 우선순위 평가 1) 우선순위 평가 방법 및 절차 - 우선순위 평가의 경우 정의된 데이터 과제에 대한 실행 순서를 정하는 것이다. - 업무별 도출된 분석과제를 우선순위 평가 기준에 따라 평가한 뒤 , 과제 수행의 선 후행 관계를 고려하여 적용순위를 조정해 최종 확정한다. 분석..