앞에서 다룬 사용자의 행동을 분석하고 , 다른 사용자와의 유사성을 기반으로 사용자가 좋아할 것으로 예상되는 사용자 기반 협업 필터링이라는 협업 필터링 방법에 대해 알아 보았다.
그러나 , 이 방법은 다음과 같은 두 가지 주요 문제가 발생한다.
1. 데이터 희박성 : 항목 수가 많으면 사용자가 평가 한 항목 수가 매우 적어 상관 계수의 안정성이 떨어진다.
2. 사용자 프로파일이 빠르게 변하고 전체 시스템 모델을 다시 계산해야 하는 데 시간과 계산 비용이 많이 든다 .
이러한 문제를 해결하기 위해 ITEM-ITEM 협업 필터링을 사용한다.
ITEM-ITEM 협업 필터링
ITEM-ITEM 협업 필터링은 사용자가 이미 평가 한 기사와 유사한 항목을 찾고 유사한 기사를 가장 많이 추천한다 . 그러나 항목 항목 유사성을 말할 때 그 의미는 무엇일까 ?
이 경우에는 만년필과 파일럿 펜과 같은 속성으로 두 항목이 같은지 여부는 둘 다 펜이기 때문에 비슷하다 . 대신 , 유사성이란 사람들이 좋아하고 싫어하는 관점에서 두 항목을 동일하게 취급하는 방식을 의미한다.
이 방법은 평균 항목이 평범한 사용자보다 훨씬 많은 평점을 갖기 때문에 사용자 기반 협업 필터링과 비교할 때 매우 안정적이다 . 따라서 개별 등급은 그 다지 큰 영향을 미치지 않는다 .
두 항목 간의 유사도를 계산하기 위해 대상 사용자가 평가 한 항목 집합을 조사하여 대상 항목 i와 얼마나 유사한 지 계산 한 다음 가장 유사한 항목을 선택한다.
두 항목 간의 유사성은 두 항목을 모두 평가 한 사용자의 등급을 취한 후 아래에 언급 된 코사인
유사성 기능을 사용하여 계산된다.
아이템 간의 유사성을 갖게되면 , 이와 유사한 아이템에 대한 타켓 사용자의 등급의 가중 평균을 취함으로써 예측이 계산된다. 평점을 계산하는 공식은 사용자 기반이 아닌 항목 간 가중치를 제외하고 사용자 기반 공동 작업 필터링과 매우 유사하다.
현재 항목에 대해 다른 사용자가 평가하지 않고 항목 또는 다른 항목에 대한 현재 사용자 등급을 사용한다.
출처 : https://medium.com/@tomar.ankur287/item-item-collaborative-filtering-recommender-system-in-python-cf3c945fae1e
'졸업작품_preparing.... > 알고리즘' 카테고리의 다른 글
Metacritic이란 무엇인가 (0) | 2019.01.20 |
---|---|
Random Forest는 무엇인가 (0) | 2019.01.14 |
의사결정나무란 무엇인가 (0) | 2019.01.12 |
결정 트리 학습법이란 무엇인가 (0) | 2019.01.12 |
추천 시스템이란?? (0) | 2018.12.27 |
#IT #먹방 #전자기기 #일상
#개발 #일상