반응형
나이키 사이트 크롤링
학부공부/데이터마이닝과통계2018. 11. 10. 21:17나이키 사이트 크롤링

이번에는 나이키(nike) 사이트를 크롤링 해 볼 것이다. 내가 가져올 값들은 아우터 부분의 아우터 이름명과 가격이다. R을 실행해서 , 크롤링에 필요한 , xml과 rvest 패키지를 로딩시켜 준다 . library(rvest)library(XML) url url에 내가 크롤링 하고자 하는 사이트의 url 값을 넣어준다. doc 이 url을 html으로써 읽어 온다 이제 html에 접근하기 위해서 nike 사이트를 접속해 주면 되는데 , Nike 사이트는 다음과 같은 구조를 가졌다. 다음을 보게 되면 아우터의 class 명은 item-location으로 지정되어 있는 것을 확인할 수 있었다. # 옷 이름 가져오기 부분 prod_name % html_nodes(".item-title") %>% html_..

쿠팡 웹 크롤링 맛보기
학부공부/데이터마이닝과통계2018. 11. 1. 23:02쿠팡 웹 크롤링 맛보기

웹 크롤링할 일이 생겨서 하다가 , 안되는 부분이 있어서 적어보고자 한다. 기존 코드이다. XML 라이브러리를 통해서 크롤링에 접근할려고 했다. library(XML) url 먼저 내가 Parsing 하고자 하는 url을 긁어온다. doc 긁어온 url을 html 코드로 변환하며 encoding 방식도 설정해 줄수 있다. prod_name 내가 긁어온 html 코드에 접근을 하고 , ul태그내에 있는 id 값이 productList인것에 1차 접근을 하고 //을 통해서 건너뛴 다음 , div 태그 내에 있는 class 값이 name인 것에 2차 접근을 하는 것이였다. 그런데 여기서 오류가 나는 것이다. Class 가 NULL이라고 한다… 내 뇌피셜이지만 class를 못찾거나 , class명이 잘못된것이라..

LISP 에서의 입력과 출력
학부공부/인공지능2018. 10. 3. 15:24LISP 에서의 입력과 출력

LISP에서의 입력 , 출력 입출력 작용은 입출력 ( I / O )함수에 의해서 수행된다 . I/O함수에는 read , print , prinl , print , terpri , format등이 있다. Read : 인수를 취하지 않는다 , 키보드로부터 입력될 때까지 수행이 잠시 중단된다. Ex ) ( + 5 (read))6è 11 인터프리터는 +함수를 발견하고서 , 수행하기 위해 인수를 찾는다 . 그러다가 read를 발견하고나서 잠시 중단이 된다 . 사용자가 6를 입력하게 되면 , read는 6을 인지하고 +함수를 수행한다 . 결론적으로 11이 반환이 되는 것이다. Print : 하나의 인수를 취한다 . 인수를 받아들인 그대로 프린트하고 동시에 그 인수를 되돌려 준다 . 이것은 어떤 것을 프린트 함과 동..

반응형
image