甲乙小朋友的房子

甲乙小朋友很笨,但甲乙小朋友不会放弃

0%

机器学习实践-CVR-word-embedding

在做比赛的过程中,我曾用过word embedding生成app特征,对结果提升了有几个万分点。

论文:tem2vec: Neural Item Embedding for Collaborative Filtering # 思想 这篇文章比较朴素,创新性不高,基本是参照了google的word2vec方法,应用到推荐场景的i2i相似度计算中,但实际效果看还有有提升的。主要做法是把item视为word,用户的行为序列视为一个集合,item间的共现为正样本,并按照item的频率分布进行负样本采样,缺点是相似度的计算还只是利用到了item共现信息,1).忽略了user行为序列信息; 2).没有建模用户对不同item的喜欢程度高低。

实现

主要代码来自于写论文的作者分享的代码

参考文献

  1. DNN论文分享 - Item2vec: Neural Item Embedding for Collaborative Filtering
  2. 达观数据推荐算法实现:协同过滤之item embedding