今年RecSys 2019上出现的一篇极具批判性的论文《Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches》。灵魂一问深度学习是否在推荐系统已经取得了足够可信的进展?在知乎上也引起了激烈的讨论:如何看待RecSys 2019上的一篇文章认为现有DNN-based推荐算法带来的基本上都是伪提升?

作者总结了过去三年四大顶会(KDD、SIGIR、WWW和RecSys)推荐系统上18个最新算法,只有7个能重现效果。而且在不同的测试数据集上它们与浅层经典方法效果对比中经常都败下阵来。并开源了评估代码与数据集。

抛开论文中提到到目前推荐系统众所周知的因为评估数据集、评估指标、以及baseline调参等问题不一致导致诸多论文算法在性能可复现上存在的诸多问题,作为产业界的算法工程师来说更多的是需要从最新的顶会工作中开拓视野、吸取不同的思路,来确定工业界线上系统中的下一步的迭代方向。不管黑猫白猫,只要应用在线上系统有确切实际效果的工作就是好工作。

1. Collaborative Memory Network for Recommendation Systemst.cn/AiRbpFAR;代码:t.cn/EPRooTK

Google at SIGIR 2018,提出CMN算法融合记忆网络与注意力机制帮助CF类算法捕捉user和item之间的高阶复杂关系。效果好于CDAE和NeuMF等,并开源了代码。

2. Leveraging Meta-path based Context for Top-N Recommendation with A Neural Co-Attention Modelt.cn/AiRbsEUf;代码:t.cn/EtOkDu7

KDD 2018,提出MCRec算法借助丰富的元路径和互注意力机制进行Top-N推荐,可以有效学习user、item以及基于元路径的上下文的表示从而学习他们之间的交互。效果好于NeuMF等,并开源了代码。

3. Collaborative Variational Autoencoder for Recommender Systemst.cn/AiRGt8SQ;代码:t.cn/EyWuDRS

KDD 2017,提出CVAE考虑多媒体场景下的推荐内容与交互数据,以无监督的方式学习item和用户的深度隐式表示以及他们之间的隐式关系。效果好于CDL等,并开源了代码。

4. Collaborative Deep Learning for Recommender Systems t.cn/AiRG66mD;代码:t.cn/AiRG66mF

KDD 2015,针对CF类方法学习用户与item的交互往往过于稀疏导致推荐效果不好的问题,提出CDL算法结合用户交互数据与item内容辅助信息来学习隐式表示。效果好于CTR和CMF等模型,并开源了代码。

5. Neural Collaborative Filteringt.cn/ROuL87r;代码:t.cn/ROuhFZP

WWW 2017,提出NCF框架使用NN网络结构代替內积形式来学习用户和item之间的交互,从而实现对MF类方法进行扩展。效果好于现有MF类方法,并开源了代码。

6. Spectral Collaborative Filtering t.cn/AiRM65fz;代码:t.cn/AiRM65VF

RecSys 2018,提出SpectralCF算法引入光谱图理论结合在用户-item二分图上进行光谱卷积操作解决CF类算法在推荐冷启动问题上的弱点。效果好于NCF等,并开源了代码。

7. Variational Autoencoders for Collaborative Filtering t.cn/RRD6veZ;代码:t.cn/RRD6veA

NetFlix at WWW 2018,基于变分自动编码器的CF算法。效果明显好于NCF和CDAE等,并开源了代码。

8. Multi-Pointer Co-Attention Networks for Recommendationt.cn/AiRotBGQ;代码:t.cn/E72ViBh

KDD 2018,基于协同注意力机制,针对用户评论以及与商品相关的评论进行重要性选择,用来学习用户与item的表示。效果好于同样基于评论建模的D-ATT/ TransNet/DeepCoNN等,并开源了代码。

9. Recurrent Knowledge Graph Embedding for Effective Recommendationt.cn/AiRKtn8B;代码:t.cn/AiRKtn81

RecSys 2018,提出一种KG embedding方法RKGE,基于RNN网络自动学习实体与实体间path的embedding表示。效果好于NCF与CKE等,并开源了代码。

10. RecGAN: Recurrent Generative Adversarial Networks for Recommendation Systemst.cn/AiRKcnxT

RecSys 2018,结合RNN和GAN提出RecGAN框架更好地学习用户item交互背后的时域与隐式特征。

11. Attentive Neural Architecture Incorporating Song Features for Music Recommendationt.cn/AiEGSrxQ

RecSys 2018,基于Attention机制结合歌曲的特征更好地学习用户短期兴趣进行下一首音乐的推荐,效果好于RNN以及基于Session的CF类算法。

12. 3D Convolutional Networks for Session-based Recommendation with Content Featurest.cn/AiEGOGz2

RecSys 2017,使用三维卷积神经网络针对序列推荐中的用户-item交互数据以及内容特征更好地进行建模,效果好于GRU4Rec等。

13. Convolutional Matrix Factorization for Document Context-Aware Recommendationt.cn/AiEGRrew;代码:t.cn/AiEGRreA

RecSys 2016,提出ConvMF算法结合CNN以及概率矩阵分解PMF更好地捕捉item的上下文信息,从而提高预测的准确度。效果好于CDL等,并开源了代码。

14. Meta-Prod2Vec: Product Embeddings Using Side-Information for Recommendationt.cn/AiEGsbzB

RecSys 2016,提出Meta-Prod2Vec算法针对Prod2Vec算法加入类别型side information。效果好于原有Prod2Vec。

15. A Contextual Attention Recurrent Architecture for Context-Aware Venue Recommendationt.cn/AiEqZfuT;代码:t.cn/AiEqLdDT

SIGIR 2018,提出CARA框架结合序列中的反馈信息以及上下文信息更好地捕获用户的动态偏好,进行酒店推荐。主要包含一个上下文注意力门和基于时间和地理位置门。效果好于GRU以及LatentCross等,并开源了代码。

16. Attentive Collaborative Filtering: Multimedia Recommendation with Item-and Component-Level Attentiont.cn/AiEq5MT6;代码:t.cn/AiEq5MTA

SIGIR 2017,提出适用于CF的注意力机制跨级啊ACF,包含component-level和item-level的注意力模块,更好地学习多媒体内容上用户的偏好。效果好于DeepHybrid等,并开源了代码。

17. Latent Relational Metric Learning via Memory-based Attention for Collaborative Rankingt.cn/AiEqIszv;代码:t.cn/AiEqMIuC

WWW 2018,提出一种协同推荐上新的度量学习方法LRML,旨在学习用户和item之间的相关关系,而不是简单的用户和项目之间的push和pull关系。采用了一个增强的存储器模块,并通过这些记忆块来构建用户和项目潜在的关系。效果好于NeuMF和CML等,并开源了代码。

18. A Multi-view Deep Learning Approach for Cross Domain User Modeling in Recommendation Systemst.cn/AiEqJyzT;代码:t.cn/AiEqJ8iv

微软 at WWW 2015,基于DSSM匹配模型提出一种跨领域构建用户模型的推荐算法MV-DSSM框架。MV-DNN联合了多个域做的丰富特征进行联合模型推荐,效果好于CTR等并开源了代码。

参考

  1. Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches

  2. 基于深度学习的推荐系统效果遭质疑,它真的有带来实质性进展吗?

09-15 08:44