반응형
Steam 에서 특정 태그에 해당하는 태그 성향 분석하기 1
졸업작품_preparing..../R_작업2018. 12. 25. 21:08Steam 에서 특정 태그에 해당하는 태그 성향 분석하기 1

Steam 에서 특정 태그에 해당하는 태그 성향 분석하기 1 Steam 게임은 게임을 좋아하는 사람이라면 알고 있는 게임 툴일 것이다. Steam에는 수많은 게임들이 존재한다. 정말 매력적인 것은 스팀에서 게임을 올릴 때 , 개발자가 각 게임에 대해서 태그 ( Tag ) 로써 게임의 성향을 써놓았다. 이 태그들을 통하여서 , 각 게임에 대해서 어떠한 특성을 가지고 있는지 알 수 있게 된다. Steam에서는 태그별로 게임들을 분류해 놓았다 . 정말 다양한 Tag들이 존재한다. 이 Tag들에 따른 Game들이 존재하게 되는데 , 과연 이 Tag 에 따른 게임들이 어떻게 다양하게 존재하고 , 얼마나 관계가 있을까 궁금했다. 그래서 나는 R 을 사용해서 크롤링을 해서 , wordcloud2를 사용해서 특정 태그..

논문제목+논문저자+논문발간일 크롤링 / wordcloud2
학부공부/데이터마이닝과통계2018. 11. 18. 19:56논문제목+논문저자+논문발간일 크롤링 / wordcloud2

오늘은 구글에서 논문 저자와 메인제목과 메인내용을 가져와 볼 것이다. 먼저 , 구글에 IT논문을 쳐서 , 검색기록들을 분석해 본다 . 그런데 , 검색을 하다보니 , 내가 찾고자 하는 정보와 관련없는 내용들이 너무 많았다…. 나는 논문관련된 정보만 추출하고 싶었다. 그래서 구글말고 논문 전문 사이트를 이용하기로 하였다. 그래서 이용하게된 DBpia 사이트 : http://www.dbpia.co.kr/SearchResult/TopSearch?isFullText=0&searchAll=IT 이 사이트는 논문의 종류가 굉장히 다양하고 정보가 많았다. 이 사이트를 이용해서 분석하기 전에 앞서 , 구글의 페이지 이동에 관해서 알아보았다. 1번째 페이지 : https://www.google.com/search?q=%E..

web_crawling + wordCloud
학부공부/데이터마이닝과통계2018. 11. 15. 01:13web_crawling + wordCloud

오늘은 웹 크롤링한 데이터를 csv ( 엑셀 ) 형태로 저장을 시키고 , 저장시킨 엑셀 파일을 정제시키고 , 데이터를 가져와서 시각화 해보는 작업을 해 볼 것이다. 내가 크롤링할 사이트는 https://www.greenclimate.fund/home 이며 영어로 된 뉴스 사이트다. 코드를 보면서 분서해 보자 . 크게 rvest 패키지와 XML패키지가 필요하며 시각화 할 때 필요한 wordcloud2 패키지가 필요하다 . 문서를 다루는 tm패키지가 보통 깔려있는데 , 나는 없어서 깔아 주었다. library(rvest)library(XML) # 크롤링을 해오기 위해서 필요한 라이브러리들 install.packages("tm")install.packages("wordcloud2") # 필요한 패키지들 #wo..

반응형
image