티스토리

IT grow.
검색하기

블로그 홈

IT grow.

dlsdn73.tistory.com/m

#IT #먹방 #전자기기 #일상

구독자
28
방명록 방문하기
공지 공지사항 모두보기
반응형

주요 글 목록

  • 데이터 분석 준전문가(adsp) - 정형 데이터 마이닝 1. 데이터마이닝 가. 개요 - 데이터마이닝은 대용량 데이터에서 의미있는 패턴을 파악하거나 예측하여 의사결정에 활용하는 방법이다. 나. 통계분석과의 차이점 - 통계분석은 가설이나 가정에 따른 분석이나 검증을 하지만 데이터마이닝은 다양한 수리 알고리즘을 이용해 데이터베이스의 데이터로부터 의미있는 정보를 찾아내는 방법을 통칭한다. 다. 종류 정보를 찾는 방법론에 따른 종류 - 인공지능 ( Artificial Intelligence ) - 의사결정나무 ( Decision Tree ) - K - 평균군집화 ( K-means Clustering ) - 연관분석 ( Association Rule ) - 회귀분석 ( Regression ) - 로짓분석 ( Logit Analysis ) - 최근접이웃 ( Nearest.. 공감수 0 댓글수 0 2020. 2. 11.
  • 데이터 분석 준전문가(adsp) - 주성분 분석 1. 주성분분석 ( Principal Component Analysis ) - 여러 변수들의 변량을 '주성분(Principal Component)' 이라는 서로 상관성이 높은 변수들의 선형결합으로 만들어 기존의 상관성이 높은 변수들을 요약,축소하는 기법이다. - 첫 번째 주성분으로 전체 변동을 가장 많이 설명할 수 있도록하고 , 두 번째 주성분으로는 첫 번째 주성분과는 상관성이 없어서(낮아서) 첫 번째 주성분이 설명하지 못하는 나머지 변동을 정보의 손실 없이 가장 많이 설명할 수 있도록 변수들의 선형조합을 만든다. 2. 주성분분석의 목적 - 여러 변수들 간에 내재하는 상관관계 , 연관성을 이용해 소수의 주성분으로 차원을 축소함으로써 데이터를 이해하기 쉽고 관리하기 쉽게 해준다. - 다중공선성이 존재하는 .. 공감수 1 댓글수 2 2020. 2. 11.
  • 데이터 분석 준전문가(adsp) - 다차원척도법 1. 다차원척도법 ( Multidimensional Scaling ) - 객체간 근접성 ( Proximity ) 을 시각화하는 통계기법이다. - 군집분석과 같이 개체들을 대상으로 변수들을 측정한 후에 개체들 사이의 유사성 / 비유사성을 측정하여 개체들을 2차원 공간상에 점으로 표현하는 분석방법이다. - 개체들을 2차원 또는 3차원 공간상에 점으로 표현하여 개체들 사이의 집단화를 시각적으로 표현하는 분석방법이다. 2. 다차원척도법 목적 - 데이터 속에 잠재해 있는 패턴(pattern) , 구조를 찾아낸다 - 그 구조를 소수 차원의 공간에 기하학적으로 표현한다. - 데이터 축소 (Data Reduction) 의 목적으로 다차원척도법을 이용한다. 즉 , 데이터에 포함되는 정보를 끄집어내기 위해서 다차원척도법을.. 공감수 0 댓글수 0 2020. 2. 10.
  • 데이터 분석 준전문가(adsp) - 시계열 분석 1. 시계열 자료 - 시간의 흐름에 따라 관찰된 값들을 시계열 자료라 한다. - 시계열 데이터의 분석을 통해 미래의 값을 예측하고 경향 , 주기 , 계절성 등을 파악하여 활용한다. 나. 시계열 자료의 종류 1) 비정상성 시계열 자료 - 시계열 분석을 실시할 때 다루기 어려운 자료로 대부분의 시계열자료가 이에 해당한다. 2) 정상성 시계열 자료 - 비정상 시계열을 핸들링해 다루기 쉬운 시계열 자료로 변환한 자료이다. 2. 정상성 가. 평균이 일정할 경우 - 모든 시점에 대해 일정한 평균을 가진다. - 평균이 일정하지 않은 시계열은 차분(difference)을 통해 정상화할 수 있다. 나.분산이 일정 - 분산도 시점에 의존하지 않고 일정해야 한다. - 분산이 일정하지 않을 경우 변환(Transformatio.. 공감수 0 댓글수 0 2020. 2. 8.
  • 데이터 분석 준전문가(adsp) - 회귀분석 1.회귀분석의 개요 가. 회귀분석의 정의 - 하나 그 이상의 독립변수들이 종속변수에 미치는 영향을 추정할 수 있는 통계기법이다. - 변수들 사이의 인과관계를 밝히고 모형을 적합하여 관심있는 변수를 예측하거나 추론하기 위한 분석방법이다. - 독립변수의 개수가 하나이면 단순선형외귀분석 , 독립변수의 개수가 두 개 이상이면 다중선형 회귀분석으로 분석할 수 있다. 나. 회귀분석의 변수 - 영향을 받는 변수 ( y ) : 반응변수 ( response variable ) , 종속변수 (dependent variable) , 결과변수 (outcome variable) - 영향을 주는 변수 ( x ) : 설명변수 ( explanatory variable ) , 독립변수 ( independent variable ) , .. 공감수 1 댓글수 0 2020. 2. 8.
  • 데이터 분석 준전문가(adsp) - 기초 통계분석 1. 기술통계 ( Descriptive Statistics ) 가. 기술통계의 정의 - 자료의 특성을 표,그림,통계량 등을 사용하여 쉽게 파악할 수 있도록 정리/요약하는 것이다. - 자료를 요약하는 기초적 통계를 의미한다. - 데이터 분석에 앞서 데이터의 대략적인 통계적 수치를 계싼해봄으로써 데이터에 대한 대략적인 이해와 앞으로 분석에 대한 통찰력을 얻기에 유리하다. 3) 분포의 형태에 관한 측도 가) 왜도 - 분포의 비대칭정도를 나타내는 측도이다. - m3 > 0 : 오른쪽으로 긴 꼬리를 갖는 분포 - m3 = 0 : 좌우가 대칭인 분포 - m3 0 : 표준정규분포보다 더 뾰족함 - m.. 공감수 1 댓글수 0 2020. 2. 7.
  • 데이터 분석 준전문가(adsp) - 통계분석의 이해 1. 통계 - 특정집단을 대상으로 수행한 조사나 실험을 통해 나온 결과에 대한 요역된 형태의 표현이다. (Ex) 일기예보 , 물가/시업률/GNP , 정당 지지도 , 의식조사와 사회조사 분석 통계 , 임상실험 등의 실험 결과 분석 통계 - 조사 또는 실험을 통해 데이터를 확보 , 조사대상에 따라 총조사(census) 와 표본조사로 구분한다. 2. 통계자료의 획득 방법 가. 총 조사 / 전수 조사 ( census ) - 대상 집단 모두를 조사하는데 많은 비용과 시간이 소요되므로 특별한 경우를 제외하고는 사용되지 않는다. ( ex. 인구주택 총 조사 ) 나. 표본조사 - 대부분의 설문조사가 표본조사로 진행되며 모집단에서 샘플을 추출하여 진행하는 조사이다. - 모집단 ( population ) : 조사하고자 하.. 공감수 0 댓글수 0 2020. 2. 1.
  • 데이터 분석 준전문가(adsp) - 기초 분석 및 데이터 관리 1. 데이터 EDA ( 탐색적 자료 분석 ) - 데이터의 분석에 앞서 전체적으로 데이터의 특징을 파악하고 데이터를 다양한 각도로 접근한다. - summary() 를 이용하여 데이터의 기초통계량을 확인한다. 2. 결측값 인식 - 결측값은 NA , 9999999 , ' '(공백) , Unknown , Not Answer 등으로 표현되는 것으로 결측값을 처리하기 위해서 시간을 많이 사용하는 것은 비효율적이다. - 결측값 자체의 의미가 있는 경우도 있는데 예를 들면 쇼핑몰 가입자 중 특정 거래 자체가 존재하지 않는 경우와 인구통계학적데이터 ( demographic data ) 에서 아주 부자이거나 아주 가난한 경우 자신의 정보를 잘 채워 넣지 않기 때문에 가입자의 특성을 유추하여 활용할 수 있다. - 결측값 처.. 공감수 2 댓글수 0 2020. 2. 1.
  • 데이터 분석 준전문가(adsp) - 데이터 가공 1. Data Exploration 가. 개요 - 데이터 분석을 위한 구성된 데이터의 변수들의 상태를 파악한다. 나. 종류 1) head(데이터셋) , tail(데이터셋) - 시작 또는 마지막 6개 record만 조회하는 함수 2) summary(데이터셋) 가) 수치형변수 : 최대값 , 최소값 , 평균 , 1사분위수 , 2사분위수(중앙값) , 3사분위수 나) 명목형변수 : 명목값 , 데이터 개수 2. 변수 중요도 가. 개요 - 변수 선택법과 유사한 개념으로 모형을 생성하여 사용된 변수의 중요도를 살피는 과정이다. 나. 종류 1) klaR 패키지 - 특정 변수가 주어졌을 때 클래스가 어떻게 분류되는지에 대한 에러율을 계산해주고 , 그래픽으로 결과를 보여주는 기능을 한다. - greedy.wilks() : .. 공감수 0 댓글수 0 2020. 1. 31.
  • 데이터 분석 준전문가(adsp) - 데이터 마트 1. R reshape를 이용한 데이터 마트 개발 가.데이터 마트 - 데이터 웨어하우스와 사용자 사이의 중간층에 위치한 것으로 하나의 주제 또는 하나의 부서 중심의 데이터 웨어하우스라고 할 수 있다. - 데이터 마트 내 대부분의 데이터는 데이터 웨어하우스로부터 복제되지만 , 자체적으로 수집될 수도 있으며 관계형 데이터 베이스나 다차원 데이터 베이스를 이용하여 구축 한다. - CRM ( customer relationship management) 관련 업무 중에서 핵심 - 고객 데이터 마트 구축 - 동일한 데이터 셋을 활용할 경우 , 최신 분석기법들을 이용하면 분석가의 역량에서는 분석 효과가 크게 차이가 나지 않기 때문에 데이터 마트를 어떻게 구축하느냐에 ㄸ라 분석 효과는 크게 차이 난다. 나. 요약변수 .. 공감수 0 댓글수 0 2020. 1. 30.
  • 데이터 분석 준전문가(adsp) - 데이터 변형 1. 주요 코드 요인으로 집단 정의 v 공감수 0 댓글수 0 2020. 1. 30.
  • 데이터 분석 준전문가(adsp) - 데이터 구조와 데이터 프레임 - 2 1. 데이터 프레임 - 데이터에서 각각의 변수에 해당하는 열들의 모임으로 R에서 활용하는 코드들은 아래와 같다. 데이터프레임 : data.frame(벡터,벡터,벡터) : 벡터들로 데이터셋 생성 레코드 생성 : new 5 , c(변수3,변수4) --> 데이터셋의 변수1과 변수2의 조건에 만족하는 레코드의 변수3과 변수4만을 조회 데이터 프레임 조회3 dfrm[grep("문자", dfrm$변수1, ignore.case = T ) , c("변수2,변수3") --> 데이터셋의 변수1 내 "문자"가 들어 있는 케이스들의 변수2,변수3 값을 조회 데이터셋 조회 subset(dfrm, select=변수 , subset=변수>조건) --> 데이터셋의 특정변수의 값이 조건에 맞는 변수셋 조회 , subset은 벡터와 리.. 공감수 0 댓글수 0 2020. 1. 28.
  • 데이터 분석 준전문가(adsp) - 데이터 구조와 데이터 프레임 - 1 1.벡터 ( Vector ) 가. 벡터들은 동질적이다. - 한 벡터의 모든 원소는 같은 자료형 또는 같은 모드 ( mode ) 를 가진다. 나. 벡터는 위치로 인덱스 된다 - V[2]는 V벡터의 2번째 원소이다 다. 벡터는 인덱스를 통해 여러 개의 원소로 구성된 하위 벡터를 반환할 수 있다. - V[c(2,3)]은 V벡터의 2번째 , 3번째 원소로 구성된 하위벡터이다. 라. 벡터 원소들은 이름을 가질 수 있다. - V length(pi) [1] 1 나. 행렬(Matrix) - R에서는 차원을 가진 벡터로 인식 다. 배열(Arrays) - 행렬에 3차원 또는 n차원까지 확장된 형태 - 주어진 벡터에 더 많은 차원을 부여하여 배열을 생성 > b dim(b) 공감수 0 댓글수 0 2020. 1. 27.
  • 데이터 분석 준전문가(adsp) - 입력과 출력 1. 데이터 분석 과정 - 분석자가 분석 목적에 맞는 적절한 분석 방법론을 선택해서 정확한 분석을 통해 얻은 결과를 통찰력을 가지고 해석함으로써 분석 과정을 마치게 된다. - 이렇게 데이터를 분석하기 위해서는 분석자가 분석을 위해 설계된 방향으로 데이터를 정확하게 입력받는 것에서부터 시작될 수 있다. - 그리고 입력된 데이터는 다양한 전처리 작업을 거쳐 분석이 가능한 형태로 재정리 됩니다. 우리는 이것을 데이터 핸들링이라고도 한다. - 또한 분석된 결과를 이해하기 쉽고 잘 해석할 수 있도록 생산하는 부분을 데이터 출력이라고 할 수 있다. 출력된 결과는 보고서의 형태로 정리되어 최종 의사결정자와 고객에게 전달되게 됨으로써 통계분석 과정은 종료된다고 할 수 있다. 2. R에서의 데이터 입력과 출력 - R에서.. 공감수 0 댓글수 0 2020. 1. 23.
  • 데이터 분석 준전문가(adsp) - R 기초 - 2 1.R 기초 중에 기초 출력하기 - 커맨드 프롬프트에 변수나 표현식을 입력 print() : 출력형식을 지정할 필요 없음 , 한번에 하나의 객체만 출력 cat() : 여러 항목을 묶어서 연결된 결과로 출력 , 복합적 데이터 구조 ( 행렬 list 등 ) 를 출력 할 수 없음 변수에 값 할당하기 공감수 0 댓글수 0 2020. 1. 22.
  • 데이터 분석 준전문가(adsp) - R 기초 - 1 1.통계 패키지 R 1) 패키지 ( Package ) 가) 패키지란 - R 함수와 데이터 및 컴파일된 코드의 모임 나 ) 패키지 불러들이기 (1) 하드디스크 - R을 설치하거나 업데이트를 통해 설치 (2) 웹 - 2014년 CRAN 저장소에는 약 5000개의 유용한 패키지가 자동설치 - install. packages( " AID " ) (3) 패키지 도움말 - library ( help = AID ) : 다운로드 된 AID 패키지의 help 다큐먼트를 보여준다. - help ( package = AID ) : 웹을 통해 AID 패키지의 다큐먼트를 보여준다 2) 프로그램과 파일 실행 스크립트로 프로그램밍 된 파일 실행하기 : source ( "파일명 " ) : 오른쪽 방향키 프로그램 파일 : sink (.. 공감수 0 댓글수 0 2020. 1. 22.
  • 데이터 분석 준전문가(adsp) - R 소개 1. 데이터 분석 도구의 현황 가. R의 탄생 - R은 오픈소스 프로그램으로 통계 , 데이터마이닝과 그래프를 위한 언어이다. - 다양한 최신 통계분석과 마이닝 기능을 제공한다. - 세계적으로 많은 사용자들이 다양한 예제를 공유한다. - 다양한 기능을 지원하는 많은 패키지가 수시로 업데이트 된다. 나. 분석도구의 비교 SAS - 프로그램 비용 : 유로 , 고가 - 설치용량 : 대용량 - 다양한 모듈 지원 및 비용 : 별도구매 - 최근 알고리즘 및 기술반영 : 느림 - 학습자료 입수의 편의성 : 유로 도서 위주 - 질의를 위한 공개 커뮤니티 : NA SPSS - 프로그램 비용 : 유료 , 고가 - 설치용량 : 대용량 - 다양한 모듈 지원 및 비용 : 별도구매 - 최근 알고리즘 및 기술반영 : 다소느림 - 학.. 공감수 0 댓글수 0 2020. 1. 21.
  • 데이터 분석 준전문가(adsp) - 데이터 분석 기법의 이해 1.데이터 처리 가. 개요 - 데이터분석은 통계에 기반을 두고 있지만 , 통계지식과 복잡한 가정이 상대적으로 적은 실용적인 분야이다. 나. 활용 - 대기업은 데이터웨어하우스 ( DW ) 와 데이터마트 ( DM ) 를 통해 분석 데이터를 가져와서 사용한다. - 신규 시스템이나 DW에 포함되지 못한 자료의 경우 , 기존 운영시스템 ( Legacy ) 이나 스테이징영역 (staging area) 과 ODS ( Operation Data Store ) 에서 데이터를 가져와서 DW에서 가져온 내용과 결합하여 활용할 수 있다. - 하지만 운영시스템에 직접 접근해 데이터를 활용하는 것은 매우 위험한 일이므로 거의 이루어지지 않고 있으며 , 스테이징 영역 ( Staging Area ) 의 데이터는 운영시스템에서 임시로.. 공감수 0 댓글수 0 2020. 1. 21.
  • 데이터 분석 준전문가(adsp) - 분석 거버넌스 체계 수립 1. 거버넌스 체계 가.개요 - 기업에서 데이터를 이용한 의사결정이 강조될수록 데이터 분석과 활용을 위한 체계적인 관리가 중요해진다. 단순히 대용량 데이터를 수집,축적하는 것보다는 어떤 목적으로 어떤 데이터를 어떻게 분석에 활용할 것인가가 더욱 중요하기 때문이다. 그리고 조직 내 분석 관리체계를 수립해야 하는 이유는 데이터 분석을 기업의 문화로 정착하고 데이터 분석업무를 지속적으로 고도화하기 위해서이다. 나. 구성요소 - 마스터 플랜 수립 시점에서 데이터 분석의 지속적인 적용과 확산을 위한 거버넌스 체계는 분석 기획 및 관리를 수행하는 조직 ( Organization ) , 과제 기획 및 운영 프로세스 ( Process ) , 분석 관련 시스템 ( System ) , 데이터 ( Data ) , 분석 관련.. 공감수 0 댓글수 0 2020. 1. 20.
  • 데이터 분석 준전문가(adsp) - 분석 마스터 플랜 1.분석 마스터 플랜 수립 프레임 워크 가.마스터 플랜 수립 개요 - 데이터 기반 구축을 위해서 분석 과제를 대상으로 전략적 중요도 , 비즈니스 성과 및 ROI , 분석 과제의 실행 용이성 등 다양한 기준을 고려해 적용 우선순위를 설정한다. - 업무내재화 적용 수준 , 분석데이터 적용 수준, 기술적용 수준 등 분석 적용 범위 및 방식에 대해서 종합적으로 고려하여 데이터 분석 구현을 위한 로드맵을 수립해야 한다. 나.수행 과제 도출 및 우선순위 평가 1) 우선순위 평가 방법 및 절차 - 우선순위 평가의 경우 정의된 데이터 과제에 대한 실행 순서를 정하는 것이다. - 업무별 도출된 분석과제를 우선순위 평가 기준에 따라 평가한 뒤 , 과제 수행의 선 후행 관계를 고려하여 적용순위를 조정해 최종 확정한다. 분석.. 공감수 0 댓글수 0 2020. 1. 20.
  • 데이터 분석 준전문가(adsp) - 분석 프로젝트 관리 방안 1.분석과제 관리를 위한 5가지 주요 영역 - 과거 형태로 도출된 분석기회는 프로젝트를 통해서 그 가치를 증명하고 목표를 달성해야 한다. 분석프로젝트는 다른 프로젝트 유형처럼 범위,일정,품질,리스크,의사소통 등 영역별 관리가 수행되어야 할 뿐 아니라 다양한 데이터에 기반한 분석기법을 적용하는 특성 때문에 5가지의 주요 속성을 고려한 추가적인 관리가 필요하다 . Data Complexity + Data Size + Speed + Analytic Complexity + Accuracy & Precision Data Complexity : BI ( Business Intelligence ) 프로젝트처럼 정형 데이터가 분석 마트로 구성되어 있는 상태에서 분석을 하는 것과 달리 텍스트 , 오디오 , 비디오 등의 .. 공감수 1 댓글수 0 2020. 1. 17.
  • 데이터 분석 준전문가(adsp) - 분석 과제 발굴 1.분석과제 발굴 방법론 가.개요 - 분석 과제는 풀어야 할 다양한 문제를 데이터 분석 문제로 변환한 후 관계짜들이 이해하고 프로젝트로 수행할 수 있는 과제 정의서 형태로 도출된다. - 분석과제를 도출하기 위한 방식으로는 크게 하향식 접근 방법 ( Top Down Approach ) 과 상향식 접근 방법 ( Bottom up Approach ) 이 있다. - 문제가 주어져 있는 상태에서 답을 구하는 하향식 접근 방식이 전통적으로 수행되었던 분석 과제 발굴 방식이다. 그러나 대규모의 다양한 데이터를 생성하고 빠르게 변하는 기업 환경에서는 문제 자체의 변화가 심재 정확하게 문제를 사전에 정의하는 것이 어려워지고 있다. - 분석 과제 발굴을 두가지 방식으로 나누었지만 , 실제 새로운 상품 개발이나 전략 수립 .. 공감수 0 댓글수 0 2020. 1. 17.
  • 데이터 분석 준전문가(adsp) - 분석 방법론 분석 방법론 개요 가.개요 - 데이터 분석이 효과적으로 기업 내에 정착하기 위해서는 이를 체계화한 절차와 방법이 정리된 데이터 분석 방법론의 수립이 필수적이다. - 프로젝트는 개인의 역량이나 조직의 우연한 성공에 기인해서는 안 되고 , 일정한 수준의 품질을 갖춘 산출물과 프로젝트의 성공 가능성을 확보하고 제시할 수 있어야 한다. - 방법론은 상세한 절차 ( Procedures ) , 방법 ( Methods ) , 도구와 기법 ( Tools & Techniques ) , 템플릿과 산출물 ( Templates & Outputs ) 로 구성되어 어느 정도의 지식만 있으면 활용이 가능해야 한다. 나.데이터 기반 의사결정의 필요성 1) 경험과 감에 따른 의사결정 --> 데이터 기반의 의사결정 2) 기업의 합리적 .. 공감수 0 댓글수 0 2020. 1. 15.
  • 데이터 분석 준전문가(adsp) - 분석기획 방향성 도출 분석기획 방향성 도출 1.분석기획의 특징 가.분석기획이란 ? - 실제 분석을 수행하기에 앞서 분석을 수행할 과제를 정의하고 , 의도했던 결과를 도출할 수 있도록 이를 적절하게 관리할 수 있는 방안을 사전에 계획하는 일련의 작업이다. - 분석과제 및 프로젝트를 직접 수행하는 것은 아니지만 , 어떠한 목표 ( What ) 를 달성하기 위하여 ( Why ) 어떠한 데이터를 가지고 어떤 방식으로 ( How ) 수행할 지에 대한 일련의 계획을 수립하는 작업이기 때문에 성공적인 분석결과를 도출하기 위한 중요한 사전 작전이다. 나.데이터 사이언티스트의 역량 - 데이터 사이언티스트는 수학/통계학적 지식 및 정보기술 ( IT기술 , 해킹기술 , 통신기술 등 ) 뿐만 아니라 해당 비즈니스에 대한 이해와 전문성을 포함한 3.. 공감수 0 댓글수 0 2020. 1. 14.
  • 데이터 분석 준전문가(adsp) - 최신 빅데이터 상식 1.DBMS와 SQL 가.DBMS 1) DBMS란 무엇인가 - DBMS 는 Data Base Management System의 약자로서 데이터베이스를 관리하여 응용 프로그램들이 데이터베이스를 공유하며 사용할 수 있는 환경을 제공하는 소프트웨어다. - 데이터베이스를 구축하는 틀을 제공하며 , 효율적인 데이터 검색 , 저장 기능 등을 제공한다. - 대표적인 데이터베이스 관리시스템에는 오라클 , 인포믹스 , 액세스 등이 있다. 2) 데이터베이스 관리시스템 종류 가) 관계형 DBMS - 이 모델은 데이터를 컬럼 ( column ) 과 로우 ( row ) 를 이루는 하나 이상의 테이블로 정리하며, 고유키 ( Primary key ) 가 각 로우를 식별한다. 로우는 레코드나 튜플로 부르며 , 일반적으로 각 테이블/.. 공감수 0 댓글수 0 2020. 1. 13.
  • 데이터 분석 준전문가(adsp) - 빅데이터 그리고 데이터 사이언스의 미래 빅데이터 그리고 데이터 사이언스의 미래 1.빅데이터의 시대 - 디지털 환경의 진전과 더불어 실로 엄청난 '빅' 데이터가 생성되고 있다. - 빅데이터 분석은 선거결과에 결정적인 영향을 미칠 수도 있다. 기업의 측면에서는 비용 절감, 시간 절약, 매출 증대, 고객 서비스 향상, 신규 비즈니스 창출, 내부 의사결정 지원 등에 있어 상당한 가치를 발휘하고 있다. 2.빅데이터 희의론을 넘어 가치 패러다임의 변화 과거 ( Digitalization ) : 아날로그 세상을 어떻게 효과적으로 디지털화하는지가 과거의 가치 창출 원천 현재 ( Connection ) : 디지털화된 정보와 대상들은 서로 연결 시작 , 연결을 더 효과적이고 효율적으로 제공하는가가 성공요인 미래 ( Agency ) : 복잡한 연결을 얼마나 효과.. 공감수 1 댓글수 0 2020. 1. 13.
  • 데이터 분석 준전문가(adsp) - 전략 인사이트 도출을 위한 필요 역량 전략 인사이트 도출을 위한 필요 역량 1.데이터 사이언스의 의미와 역할 가.의미 - 데이터 사이언스란 데이터 공학, 수학, 통계학, 컴퓨터공학, 시각화, 해커의 사고방식, 해당 분야의 전문지식을 종합한 학문이다. 데이터로부터 의미있는 정보를 추출해내는 학문으로 정형 또는 비정형을 막론하고 인터넷, 휴대전화, 감시용 카메라 등에서 생성되는 숫자와 문자, 영상 정보 등 다양한 유형의 데이터를 대상으로 분석 뿐 아니라 이를 효과적으로 구현하고 전달하는 과정까지를 포괄적 개념이다. 나.역할 - 데이터 사이언티스트는 비즈니스의 성과를 좌우하는 핵심이슈에 답을 하고, 사업의 성과를 견인해 나갈 수 있어야 한다. 이는 데이터 사이언스의 중요한 역량 중 하나인 소통력이 필요한 이유이다. 2.데이터 사이언스의 구성요소 .. 공감수 0 댓글수 0 2020. 1. 13.
  • 데이터 분석 준전문가(adsp) - 빅데이터 분석과 전략 인사이트 빅데이터 분석과 전략 인사이트 1. 빅데이터 열풍과 희의론 빅데이터의 열풍은 '빨리 끓어 오른 냄비가 빨리 식는다'는 일종의 거품현상을 우려하는 시선도 없지 않다. 그래서 벌써부터 빅데이터 희의론이 심심찮게 흘러 나오기까지 하여 , 자칫 이런 희의론이 갖는문제는 실제 우리가 빅데이터 분석에서 찾을 수 있는 수많은 가치들을 제대로 발굴해 보기도 전에 그 활용 자체를 사전에 차단해 버릴 수 있다. 2.빅데이터 희의론의 원인 및 진단 가.투자효과를 거두지 못했던 부정적 학습효과 --> 과거의 고객관계관리 ( CRM ) - 과거 CRM의 부정적 학습효과 --> 공포 마케팅이 잘 통하는 영역 : 도입만 하면 모든 문제를 한번에 해소할 것처럼 강조 --> 막상 거액을 투자하여 하드웨어와 솔루션을 도입해도 어떻게 활.. 공감수 0 댓글수 0 2020. 1. 11.
  • 데이터 분석 준전문가(adsp) - 미래의 빅데이터 미래의 빅데이터 빅데이터 활용의 3요소 가.기본 3요소 데이터 --> 모든 것의 데이터화 기술 --> 진화하는 알고리즘 , 인공지능 인력 --> 데이터 사이언티스트 , 알고리즈미스트 1) 데이터 - 모든 것을 데이터화 ( Datafication ) 하는 현 추세로 특정 목적없이 축적된 데이터를 통한 창의적인 분석이 가능해져 , 새로운 가치로 부상하고 있다. 2) 기술 - 대용량의 데이터를 빠르게 처리하기 위한 알고리즘의 진화와 함께 스스로 학습하고 데이터를 처리할 수 있는 인공지능 기술이 출현하였다. 3) 인력 - 빅데이터를 처리하기 위한 데이터 사이언티스트와 알고리즈미스트의 역할을 통해 빅데이터의 다각적 분석을 통한 인사이트 도출이 중요해지고 있다. * 데이터 사이언티스트 : 빅데이터에 대한 이론적 지.. 공감수 0 댓글수 0 2020. 1. 11.
  • 데이터 분석 준전문가(adsp) - 위기 요인과 통제 방안 위기 요인과 통제 방안 1.빅데이터 시대의 위기 요인 가.사생활 침해 - 개인정보가 포함된 데이터를 목적 외에 활용할 경우 사생활 침해를 넘어 사회,경제적 위협으로 변형될 수 있다. (Ex) 여행 사실을 트위트 한 사람의 집을 강도가 노리는 고전적 사례 발생 --> 익명화 ( anonymization ) 기술 발전이 필요하다 나.책임 원칙 훼손 - 빅데이터 기본분석과 예측기술이 발전하면서 정확도가 증가한 만큼 , 분석대상이 되는 사람들은 예측 알고리즘의 희생양이 될 가능성도 증가한다. 민주주의 국가에서는 잠재적 위협이 아닌 명확한 결과에 대한 책임을 묻고 있어 이에 따른 원리를 훼손할 가능성이 있다. (Ex) 영화 "마이너리티 리포트"에 나오는 것처럼 범죄 예측 프로그램에 의해 범행을 저지르기 전에 체포.. 공감수 0 댓글수 0 2020. 1. 11.
    반응형
    문의안내
    • 티스토리
    • 로그인
    • 고객센터

    티스토리는 카카오에서 사랑을 담아 만듭니다.

    © Kakao Corp.