本文主要研究User fatigue (包括same item fatigue和same category fatigue)(用户的兴趣随着物品/类别重复显示次数的增加而改变) 对推荐列表被用户点击概率的影响(CTR)。

基于历史数据的统计信息,文章研究了多个与User Fatigue有关的因素,并得出了一些的结论

  1. 所有用户(包括文中分出的三类用户)都会随着物品重复显示次数的增加而降低CTR
  2. Heavy User 和 Medium User点击模式的多样性要强于Light User, Light User更专注,要么不点,要么倾向于对同一个item点击多次
  3. 所有类别的用户,之前点击同一item的次数越多,这一次再此点击的可能性越大(对同一事件的持续追踪)
  4. 人口统计特征对于User fatigue的影响: (性别;年龄 影响不大,可忽略)
  5. category level 相比于 item level , user fatigue 并不那么明显,category 更能可靠捕捉用户的兴趣(这条结论在我自己的研究中也被证实,尤其是针对隐式反馈)。
  6. 位置影响,上一次显示的位置对这一次影响很大
  7. 时间影响
  8. 这里面有关于MRR和MAP指标的描述
  9. LambdaMart [18] is the ranking algorithm, 它采用了gradient-boosted decision tree approach for optimizing a variety of non-continuous ranking objective functions.
    Q. Wu, C. J. C. Burges, K. M. Svore, and J. Gao. Adapting boosting for information retrieval measures. Inf. Retr.,13(3):254–270, 2010.


启示与收获:

  1. 本文对于实验的描述十分详尽,通篇几乎都是描述实验结果然后得出相应结论,所以这里的句法和行文结构可以进一步学习和借鉴
  2. 本文研究思路可以借鉴:寻找一个有可能影响用户行为的因素(如上下文信息(时间,地点),这里的user Fatigue,用户社交信息,多样性,惊喜度,隐私保护,虽然已经很难找了),然后可以通过简单的统计分析足以证明他的正确性和合理性。这要比通过一定技巧把别人提出的“因素”融合到自己的模型当中,要更有价值。
    不过话说回来了,是否可以研究一下把User Fatigue,用户隐私等看起来高大上的因素融入到L2R或其他模型当中?
  3. LambdaMart 排序方法可以学习和借鉴下
  4. 用户的兴趣关于时间drift (temporal dynamic) [分割时间time slot, time span]
  5. 用户的兴趣随着社交关系的改变而改变(social-based)


留言

登录 请先登陆, 再留言!