반응형
데이터 모으기(3)
학부공부/빅데이터기술_프로젝트2019. 5. 1. 01:28데이터 모으기(3)

기존에 구현에 놓았던 코드에서 "원격 제어자에 의한 강제 종료" 로 골치아팠다. 나는 현재 데이터를 최대한 모아야 하는 상황이며 최적의 방법은 Steamspyapi에서 제공하는 api를 사용하여서 데이터를 모으는 방법이 최고라고 생각을 하고 진행을 하였다. 그래서 구현해 놓은 코드가 있었는데 Error가 나는것이다... 2틀정도 고민과 방법을 찾아보았다. 해결방법은 다음과 같다. 어차피 나의 목적은 최대한 많은 Steam게임의 데이터를 구해야 하며 최대한 빠르게 모아야 한다. 그래서 API에서 제공하는 all 이라는 requests가 있다. 이 all은 steamspyapi에서 제공하는 gamedata의 모든 것이다. 이 all을 사용하여서 requests를 보낸뒤 그 정보를 json형태로 저장을 했다...

데이터 모으기(2)
학부공부/빅데이터기술_프로젝트2019. 4. 29. 23:28데이터 모으기(2)

저번에 구현해 놓은 코드를 기반으로 이번에는 조금 더 많은 데이터를 가져오기 위해서 받아오는 데이터의 양을 늘려보았다. 원래 100개 안팎인 데이터에서 1000개 단위의 데이터로 늘렸다. Error가 뜬다. 내 생각에는 중간에 네트워크의 변경이 있거나 SteamspyAPI에서 호스트를 끊어버리거나 인데 아직 해결을 못했다. 시간이 없기 때문에 빨리 해결해야 할 듯하다. 먼저 생각해 본 해결방안은 다음과 같다. 1.소수의 데이터는 문제없이 돌아간다. 2.이 내용을 기반으로 1000개의 데이터씩 쪼개서 데이터를 가져온뒤 한꺼번에 데이터를 취합한다. 꾸준히 해봐야겠다.

필요한 데이터 모으기(1)
학부공부/빅데이터기술_프로젝트2019. 4. 27. 22:23필요한 데이터 모으기(1)

먼저, Steamspy_api를 사용해서 필요한 데이터를 모아보겠다. 코드를 통해서 Steamspy_data를 어떻게 얻어 오는지 알아본다. import urllib.parse import requests import pandas as pd # Steamspy API Get main_api = "http://steamspy.com/api.php?request=tag&tag" Searching_tags = "http://steamspy.com/api.php?request=appdetails&appid=" 필요한 library와 두개의 api를 사용해서 필요한 데이터를 얻어올 것이다. Userinput = ['SINGLE', 'MULTI', 'COOP', 'MMO', 'ISFREE', 'FREETOPLAY'..

학부공부/빅데이터기술_프로젝트2019. 4. 27. 21:47machine_learning_project

Steam_game Data를 가지고, 지도학습 프로젝트를 하나 해볼려고한다. Data는 Steamspy_api를 사용해서 모을 것이고 부족하다고 싶어서 Metacritic에서 game에 대한평가or평가점수를 가져올려고 한다. 예측하고자 하는 Y값은 Price,Game_name이다. 첫 번째로 예측할 것은 Price이다. price를 예측할 때, X값은 game에 해당하는 positive,negative의 숫자형 자료인데, X값이 부족하다고 생각이 들어서, Metacritic에서 game에 해당하는 Metacritic의 전문가 점수와, User의 점수를 가져올 생각이다. 더 나아가서 , initialprice 와 price의 점수를 비교해서 , 어떠한 속성이 이 가격의 변동을 불러왔는지도 예측하고싶다. ..

반응형
image