核心思想:套上Bandit policy概念,本质是content-based线性回归模型?

最终优化目标如下:

其中,r,X,S (S为两个X之间的联系程度)已知,求U和\theta,U为source domain到target domain的转换矩阵。两次利用U进行的域之间的转换值得借鉴,尤其是直接对content-based的X进行转换。其他方法一般只是对参数\theta 进行转换。问题是:这样用U有道理么?文中说,当source domain 和target domain为同一个领域时,U变为单位矩阵。从这个特例来看,还是有些道理的。

 

 

 



留言

登录 请先登陆, 再留言!