Listwise Collaborative Filtering

核心思路
  1. 对比pairwise, 认为listwise更有效
  2. 是基于memory-based的listwise
  3. Loss Function: Cross Entroy Error
主要步骤
  1. 利用Plackett-Luce model 求各个用户在observed item 上的permutation 分布
  2. 利用上述分布和Kullback-Leibler(KL) divergence [肯德尔等级相关系数的改进版=>它是pairwise的] 可求相似用户
  3. 再在近邻上学习目标用户在unobserved items  上的分布 [梯度下降: 使得目标用户在unobserved items上的分布与近邻用户之间的同物品上的分布Loss Function最小]
  4. 最后有了在unobserved items 上的分布后, 就可以直接根据此分布进行排序推荐了.

补充知识点:

  1. 肯德尔等级相关系数
    -> 根据两个列表中各自item形成的偏序关系的一致性,从而确定两个列表之间的关系
    -> 放到推荐领域中来看:用户对物品的偏好是可以进行排序的(或者是有等级划分的),比较两个用户这种偏序关系的一致性(即求他们的之间的Kendall系数),就可以反应这两个用户之间的相似关系
    -> 这跟Pearson correlation是有本质区别的(关注点不同,Kendall更关注偏序关系,这比单纯的从单个item考虑形似度在某些情况下,更合理)
    从这个角度出发,采用Kendall系数计算用户相似度的方法,也可以称之为pairwise的(但仍然区别于L2R,前者是memory-based的,后者一般为model-based的)

 


附件:



留言

登录 请先登陆, 再留言!