이번 포스팅에서는 Implicit Feedback데이터를 활용해 MF를 학습할 수 있는 논문의 기법에 대해 소개해보려고 합니다! 베이지안 추론에 기반하고 있으며 접근이 재밌고 기발해서 유명해진 방법이라고 합니다! Introduction 1) 사용자의 클릭, 구매 등의 로그는 Implicit Feedback 데이터 2) binary(0/1)로 이루어져있음 -> 선호도를 고려하지 않고 일반적으로 유저가 아이템을 클릭/구매 할 확률을 예측하는 문제 3) 유저가 item i보다 j를 좋아한다면? 이라는 정보를 사용해 MF의 파라미터를 학습하는 방법 => 관측되지 않은 데이터에 대해서 유저가 아이템에 관심이 없는 것인지 / 유저가 실제로 관심이 있지만 아직 모르는 것인지 고려해야됨... Personalized R..
# Latent Factor Model? 간단하게 말하면 임베딩을 한다는 뜻! 다양하고 복잡한 유저와 아이템의 특성을 몇개의 벡터로 compact(작게?) 표현 -> 유저와 아이템을 같은 차원 벡터로 표현하여 나타냄 -> 같은 벡터 공간에서 유저와 아이템의 유사한 정도를 눈으로 확인할 수 있음 예시) # 전통적 SVD란? Matrix Factorization의 코어 아이디어가 됨! Rating Matrix R에 대해서 1) 유저 잠재 요인 행렬 2) 잠재 요인 대각행렬 3) 아이템 잠재 요인 행렬 이렇게 세가지의 행렬로 분해하는 것이다. => 이것은 그냥 선형대수학에서의 개념으로 유저와 아이템을 정해진 차원으로 임베딩하고싶다면? # Truncated SVD? 대표값으로 사용될 k개의 특이값만 사용한다. ..
지금까지 유저/아이템 간의 유사도를 구해 추천을 하는 User-based나 Item-based 같은 Neighborhood-based CF에 대해 공부를 해봤습니다! 이번 포스팅에서는 머신러닝 모델을 활용하는 Model-based CF에 대해 적어보려고 합니다! # 모델 기반 협업 필터링? -SVD(Singular Value Decomposition) -MF(Matrix Factorization) / SGD, ALS, BPR 등의 종류가 있음.. 유저/아이템 간의 유사도에 의존하는 기법들은 데이터의 sparsity(데이터의 빈공간?)에 취약하고 추천 결과를 생성할 때마다 많은 연산을 요구하게 됩니다! - Model-based CF는 머신러닝 모델을 사용하며 데이터..
저번 포스팅에서는 컨텐츠 기반 추천인 CB(Content-based Recommendation)에 대해 공부해봤는데요! 이번에는 많이 쓰이는 협업필터링(CF)에 대해 적어보려고 합니다!! # 협업 필터링? : CF(Collaborative Filtering) => 유저 A와 비슷한 성향을 갖는 유저들이 선호하는 아이템을 추천한다. => 아이템이 가진 속성을 사용하지 않으면서도 높은 성능을 보임! # 1) User-based Collaborative Filtering : 두 유저가 얼마나 유사한 아이템을 선호하는가? 유저간의 유사도를 구한뒤, 나와 유사도가 높은 유저들이 선호하는 아이템을 추천함! 예시 ) User B가 스타워즈에 매긴 평점을 예측하고 싶은 상황에서 User A,B가 각 영화에 매긴 평점을..
말그대로 인기있는 제품을 추천해주는 것이 인기도 기반 추천이다.! [1. Most Popular] : 조회수가 가장 많은 아이템을 추천 예 ) 뉴스추천(다른 유저들도 관심을 가지고 있는 핫한 이슈를 보기 위함) 예 ) 10명의 뷰(인기도), 6시간 지남 -> 10-6/4=8.5 25명의 뷰(인기도), 24시간 지남 -> 25-24/4=21 이 방식의 문제점은 pageview(인기도)가 더 빠르게 늘어난다면 1~2년이 지나도 계속해서 같은 글이 Top Rank에 보일 것임! 뉴스의 가장 중요한 속성은 최신성! 최신성을 고려하기 위해 업로드 날짜를 고려해줘야한다! # 방법1) Hacker News Formula 시간이 분모에 있어 시간이 지날수록 age가 점점 증가하므로 score가 작아진다! age를 고려..
강사님의 소개 - 추천시스템 구현을 목표로 두고 공부를 한 것은 아님 - 머신러닝 공부 -> 업무 : 추천, 광고 - 추천시스템은 비즈니스, 서비스와 맞닿아 있음 - 성과가 바로바로 옴 / 재밌음 이 강의가 당장 적용할수 없을지라도 좋은 자료가 될 것임! [1-1] 추천시스템 기초 # 추천(Recommendation)이란? Search(검색) : 명확하게 원하는 것을 가져옴 Recommend(추천) : 검색하지 않아도 알아서 알려줌 -> push방식 # Long-Taile 추천 - Popular products : 왼쪽의 파란색 면적은 모두에게 인기있는 모두가 좋아하는 제품이다. - Long Tail : 우측의 연두색 면적으로 Long tail의 면적이 커진다면 좋은 플랫폼으로 서비스의 질이 높아진다고 ..
2021년 여름에 수료한 데이터청년캠퍼스에서 수료생을 대상으로 하는 심화학습 프로그램이 개설되어 1년동안 원하는 강의를 선택하여 수강할 수 있게 되었습니다! 이렇게 7가지 코스가 있고 듣고싶은 코스가 많았지만 ㅠㅠ 저는 평소에 공부해보고 싶었던 부분 중 하나인 비즈니스 Case와 딥러닝을 활용한 추천시스템 구현 코스를 선택하였습니다!! 수료 후에는 이런..멋있는 수료증도 받았답니다..ㅎ 내용 자체가 처음 접하는 부분이고 배울 점이 많다보니까 강의를 한번 더 듣고 공부하면서 이해한 내용을 블로그에 정리해보려고 합니다!