machine_learning_project학부공부/빅데이터기술_프로젝트2019. 4. 27. 21:47
Table of Contents
반응형
Steam_game Data를 가지고, 지도학습 프로젝트를 하나 해볼려고한다.
Data는 Steamspy_api를 사용해서 모을 것이고
부족하다고 싶어서 Metacritic에서 game에 대한평가or평가점수를 가져올려고 한다.
예측하고자 하는 Y값은 Price,Game_name이다.
첫 번째로 예측할 것은 Price이다.
price를 예측할 때, X값은 game에 해당하는 positive,negative의 숫자형 자료인데,
X값이 부족하다고 생각이 들어서, Metacritic에서 game에 해당하는 Metacritic의 전문가 점수와, User의 점수를 가져올 생각이다.
더 나아가서 , initialprice 와 price의 점수를 비교해서 , 어떠한 속성이 이 가격의 변동을 불러왔는지도 예측하고싶다.
이 부분은 시간이 남은다면 말이다.
이 때 사용될 알고리즘은 linear regression algorithm 이다.
두 번째로 예측해보고자 하는 것은 Game_name이다.
Game_name을 예측할 때 사용될 알고리즘은 트리 알고리즘이며
트리 알고리즘을 해본뒤 그래디언트 부스팅 알고리즘을 사용해볼 계획이다.
Game_name을 예측할 때 사용될 X 속성들은 Game_tags 이다.
과연,
내가 예측하고자 하는 값들이 제대로 나올지와
예측한 값들을 정확하게 예측하기 위해서는 어떤 알고리즘을 사용해야할지와
예측하는 정확도를 높이기 위한 방법은 어떤것일지와
부족한 속성들을 어떻게 매꿀지와
데이터에 NULL 값 처리를 어떻게 해야할지
잘 될까 ..
반응형
'학부공부 > 빅데이터기술_프로젝트' 카테고리의 다른 글
데이터 모으기(4) (0) | 2019.05.05 |
---|---|
HTTP Error 403: Forbidden (0) | 2019.05.05 |
데이터 모으기(3) (0) | 2019.05.01 |
데이터 모으기(2) (0) | 2019.04.29 |
필요한 데이터 모으기(1) (0) | 2019.04.27 |
@IT grow. :: IT grow.
#IT #먹방 #전자기기 #일상
#개발 #일상