Related work for cross-domain CF models:

(1) 通过common knowledge(user characters;item attributes[9]; semantic networks[16])连接source domain和target domain,如:
    a)同构(Homogeneous )数据一般采样此类方法,异构(Heterogeneous)数据此方法难度较大,不过通过tags或者其他合适的suitable knowledge repositories【17】可以解决这个问题,(甚至是没有共同的users或者items[10:TagCDCF]。
    b) 这类方法试图通过某些方法增加两个领域之间的overlapped information.

(2) 通过隐向量连接source domain和target domain[18]
    a) tensor factorization algorithm (这种方法要求两个领域的用户统一Homogeneous)【6】

本文迁移思路(相对简单):

(1)users和 items部分overlap,两个评分矩阵

(2)最优化两个评分矩阵的最小评分误差,以及让user/item的隐向量尽可能的同他的近邻差别较小(隐向量之间评分误差),同时以相似度为权重,文中称之为近邻平滑。近邻中可能存在source domain中的user或者item (overlapped users/items?),由此达到迁移的目的。(其他领域样本×权重,融入本领域)

(3)最后统一优化目标(线性组合),SGD求解。

 

 



留言

登录 请先登陆, 再留言!