반응형
쿠팡 웹 크롤링 맛보기
학부공부/데이터마이닝과통계2018. 11. 1. 23:02쿠팡 웹 크롤링 맛보기

웹 크롤링할 일이 생겨서 하다가 , 안되는 부분이 있어서 적어보고자 한다. 기존 코드이다. XML 라이브러리를 통해서 크롤링에 접근할려고 했다. library(XML) url 먼저 내가 Parsing 하고자 하는 url을 긁어온다. doc 긁어온 url을 html 코드로 변환하며 encoding 방식도 설정해 줄수 있다. prod_name 내가 긁어온 html 코드에 접근을 하고 , ul태그내에 있는 id 값이 productList인것에 1차 접근을 하고 //을 통해서 건너뛴 다음 , div 태그 내에 있는 class 값이 name인 것에 2차 접근을 하는 것이였다. 그런데 여기서 오류가 나는 것이다. Class 가 NULL이라고 한다… 내 뇌피셜이지만 class를 못찾거나 , class명이 잘못된것이라..

웹 스크래핑 맛보기(Web Scraping)
학부공부/데이터마이닝과통계2018. 10. 30. 11:13웹 스크래핑 맛보기(Web Scraping)

웹 스크래핑이란?--> 웹 문서로부터 유용한 정보를 추출하는 기술이다. 예제를 통해서 익혀보자. library(XML)library(RCurl)스크래핑을 하기 위해서는 XML , RCurl 라이브러리가 설치되어 있어야 한다. 첫 번째로는 내가 검색을 할때 , 한국어로 할지 , 또는 영어로 검색을 할지 정해야 한다.영문으로 할때와 한국어로 할때 두가지 경우만 보겠다. query

반응형
image