新闻App是人们日常生活中获取信息来源的重要方式。在2010年左右,国外比较火的新闻App包括Zite和Flipboard等等,而国内比较火的新闻App主要是四大门户。而随着今日头条为代表的新时代新闻推荐产品的火爆,新闻App进入了全新的时代。而科技公司,不管哪一家,只要掌握了高精尖的新闻推荐算法技术,就基本在技术层面掌握了主动权和话语权。
今天,我们来看一篇 RecSys 2023 的最佳长论文提名奖论文 —— Going Beyond Local: Global Graph-Enhanced Personalized News Recommendations。这篇论文提出了一种全新的基于内容相似度计算的算法,用来进行新闻推荐。
该算法的整体架构图如下图所示:
我们首先按照如下方式定义新闻文本内容(我们这里只利用新闻标题)的词向量 X :
新闻的局部词向量特征可以按照如下方式进行表示:
这个公式是用户侧的特征表示。我们下面定义, 也就是局部实体特征。其实就是把所有的新闻标题拼成一个数组,然后再用上面的公式计算出来。
上面我们介绍的是局部特征表达和用户侧的特征表达。我们下面用 GNN 来表达全局的新闻侧特征向量:
全局新闻侧特征向量的最终表达其实就是把这些特征向量拼在一起:
整个新闻推荐系统的最终训练损失函数如下:
下面,我们来看一下实验对比效果:
经过对比(上表),我们发现我们新设计的算法(GLORY)在许多指标上都要优于同类算法,因此是不可多得的优秀的新闻推荐算法。整个算法设计思路非常简单,但是却用到了重量级的深度学习技术。想必作者在设计算法的过程中做了很多手艺类的工作,使得算法最终的效果达到了出类拔萃的程度。
下面是利用不同的 Graph Encoder 给新闻类文本编码的实验对比效果。可以看到,使用 GNN 得到的效果最优:
GLORY 是近年来出现的非常优秀的新闻推荐算法。虽然该算法没有逃脱基于内容的相似度计算的老旧框架,但是新瓶装旧酒,作者充分利用了新的技术,套在老的套娃里,产生了新的价值。这篇论文,非常值得我们认真学习。