IT grow. 2019. 4. 27. 21:47
반응형

Steam_game Data를 가지고, 지도학습 프로젝트를 하나 해볼려고한다.

 

Data는 Steamspy_api를 사용해서 모을 것이고

부족하다고 싶어서 Metacritic에서 game에 대한평가or평가점수를 가져올려고 한다.

 

예측하고자 하는 Y값은 Price,Game_name이다.

 

첫 번째로 예측할 것은 Price이다.

price를 예측할 때, X값은 game에 해당하는 positive,negative의 숫자형 자료인데,

X값이 부족하다고 생각이 들어서, Metacritic에서 game에 해당하는 Metacritic의 전문가 점수와, User의 점수를 가져올 생각이다.

더 나아가서 , initialprice 와 price의 점수를 비교해서 , 어떠한 속성이 이 가격의 변동을 불러왔는지도 예측하고싶다.
이 부분은 시간이 남은다면 말이다.

이 때 사용될 알고리즘은 linear regression algorithm 이다.

 

두 번째로 예측해보고자 하는 것은 Game_name이다.

Game_name을 예측할 때 사용될 알고리즘은 트리 알고리즘이며

트리 알고리즘을 해본뒤 그래디언트 부스팅 알고리즘을 사용해볼 계획이다.

Game_name을 예측할 때 사용될 X 속성들은 Game_tags 이다.

 

과연,

내가 예측하고자 하는 값들이 제대로 나올지와
예측한 값들을 정확하게 예측하기 위해서는 어떤 알고리즘을 사용해야할지와
예측하는 정확도를 높이기 위한 방법은 어떤것일지와
부족한 속성들을 어떻게 매꿀지와
데이터에 NULL 값 처리를 어떻게 해야할지

 

잘 될까 .. 

 

반응형