Extending Average Precision to Graded Relevance Judgments

主要贡献: 提出了基于MAP改进的GAP排序指标, 该指标可被用于graded relevance domains


对于GAP的理解有几点需要注意:

  1.  这里所谓的支持multi-graded relevance数据的建模, 并不是我们直观意义上的像nDCG那样的直接将multi-graded relevance融入到function当中
  2.  而是依旧从binary relevance出发, 将multi-graded relevance 强制分为两类,需要设定一个分为两类的阈值
  3.  作者认为, 阈值设定为多少, 是遵循一定分布的(文章中有详细论证)
  4.  最后在阈值的分布下求得最终的期望及GAP
  5.  有一点值得研究: 文中最终的期望并不是先分别求不同阈值下的MAP,在加权求和的, 具体原因文章有所描述, 而将阈值对应的概率直接融合到GAP式子当中,然后再研究阈值概率对GAP的影响
  6.  如何确认阈值概率分布(这篇文章有提到一种方法: http://nuoku.vip/users/2/articles/18

几点启发:

  1.  multi-graded relevance 可以转化成binary-graded relevance进行考虑,那么binary-graded relevance 也可以转化成multi进行考虑(利用click统计信息, 以及相似用户影响, 或者这两个信息相融合?) 
  2.  这里所谓的multi-graded relevance一般都是整数(如:1-5星),所以如何将binary-graded relevance转化过来也知道考虑(相似用户个数可设为最大graded)
  3.  解决了上述两个问题,是否就可以优化求导求模型了?
  4.  另外,可不可以直接像nDCG那样,将multi-graded relevance融合到function当中,如这篇文章: http://nuoku.vip/users/2/articles/19


留言

登录 请先登陆, 再留言!