Improving Purchase Behavior Prediction with Most Popular Items 

  1.  将session-based引入到购买预测上
    session-based 指的是在一段时间内发生的点击行为, 基于此,来预测用户是否会进行购买行为
  2. 本文主要思想是要通过实验验证两个结论的正确性, 并解释了其原因:
    选用流行物品纳入机器学习模型更有利于模型的学习; 将物品之间的关系纳入到模型当中,也助于模型的学习
  3.  论证方法
    利用LR, FM, GB(Gradient Boosting decision tree) 模型之间的区别( 能容纳的属性有层次上的区别)
    分别构建不同维度的属性向量:
    1) 将流行物品当做属性 (设置流行度阀值)
    2) 物品之间的关系纳入到属性 (如: LR不会考虑属性之间的关系; FM会考虑; GB考虑的更多)
    3) 最后证明, 融入了流行物品和物品之间关系的模型,表现最好
  4. 对应结论的现实解释:
    1) 在每次session中, 点击的流行物品数越多, 该此session发生购买行为的可能性越大
        The reason may be that the most popular items tend to be bought, and the sessions which include the most popular items are more likely to be buy session.
    2) 类似于促销活动会导致物品之间产生联系, 所以将物品之间的联系纳入到学习模型当中, 会提升模型的性能
  5. 启示
    1) 可以结合其他模型考虑session-based推荐方案
    2) 是否也可以像该文一样, 不是用"现象"去提升(开发)模型, 而是用实验去论证"现象"?
    3) 学习把握将"现象"跟模型结合起来
    4) 是否不必局限于算法, 而是可以开拓推荐新的应用场景(如,将推荐算法引用到其他领域,想IoT)


留言

登录 请先登陆, 再留言!