利用attention机制,把word embeddings生成sentence embeddings,再利用sentence embedding生成story embedding。

同理,把演员表集合中导演embedding生成Cast embeddings,

把以上两者并接起来(concatenate)

因为一个时间演员集合,一个是文本描述。所以是Multimodal.

本文绘图很紧致;提出了一个在softmax 之前改变因变量的函数ISR;本文在学出权重(attention)后,还visualization了结果。比如用深颜色表达权重大的words或setences



留言

登录 请先登陆, 再留言!