这篇博文不直接谈文章具体解决问题的方法,但从本文导出的几个问题值得研究和注意:

  1. Learning to rank (L2R) 与 Learning based on ranking(LoR)
    这两个概念在很大程度上可以混用(实际上,几乎所有文献都采用的是前者,后者基本上以pairwise和listwise替代了,而且没人采用后者这种描述,但为了描述这之间的微小区别我才这么命名的).
    1) L2R的概念是相对rating prediction提出来的,是问题域层面上的. RecSys领域最开始是面向显性评分数据展开的,其解决的主要问题是利用已有的评分数据去估计用户未曾交互的物品的评分,此时,预测评分的准确性决定了model的好坏(model拟合的是用户对已有物品的评分); 但之后有人提出,绝对的评分准确度并没有太多的实际意义,因为现在大多数的推荐系统给出的是一个推荐列表,也就是要解决top-N的问题,给候选推荐物品进行排序才是RecSys的本质任务, 因此也就有了L2R的概念. 值得注意的是,Rating prediction在得到绝对评分后,也可以根据这个绝对评分进行排序, 但它之所以不能归属L2R的原因是:它的侧重点并不在于排序(在于预测评分),排序只是间接的产物.
    2) LoR是一种学习策略,是技术层面上的. 1)中说到rating prediction中的模型主要是用来拟合用户对已有物品的评分(pointwise),而LoR是要求模型拟合用户关于物品之间的偏序关系(pairwise)或者用户关于物品集合的全序关系(listwise)
    3) 用来解决L2R问题的方法是否一定采用LoR学习策略? (目前接触到的方法好像都是这样的,但是个人认为这条不一定成立,有待进一步确认)
    4) 采用了LoR学习策略的一定是L2R方法? 一般认为这条是靠谱的
    5) 这是鉴于3)和4), 大家都用L2R包含了both.
  2. 文中还有一个关于隐式推荐的论点非常有意思,本人也非常认同:
    1) 如果用rating prediction的方法来解决隐式推荐,并且set missing values=0,再假设model拥有enough expressiveness能力的话(model完美拟合数据),排序甚至推荐将无从谈起,因为所有应该排序的物品都学成了0.(奇怪的是: The only reason why such machine learning methods can predict rankings are strategies to prevent overfiting, like regularization)
    2) 反观LoR, 就不会出现1)中的情况, 但问题是, 假设也在这种完美拟合的情况下(即拟合所有历史数据中的所有偏序/全序关系), 那么原始数据中本来就不存在的missing values中的偏序/全序关系来自哪?
            个人认为: context-based确实是学出了各特征的权重(影响因子); collaborative-based (neighborhood-based)更多的是源于偏序关系的密度(进而可认为是item的流行度),这其实就是collaborative-based方法的本质, missing value item在近邻中的流行度,流行度越高,被推荐的可能性越高. 只不过基于模型的L2R的更有可能是全局的流行度(所谓的全局最优).
  3. 文中另提到几个基于隐式的推荐模型
    WR-MF

    MMMF


留言

登录 请先登陆, 再留言!