随着 Transformer 模型的出现,更重要的是随着 BERT 的出现,生成大型多模态对象(比如图像、文本、音频等)的特征表示变得更加简单和准确,如果同时使用GPU,计算也可以进行并行加速。这就是embedding的作用,那么我们应该如何使用它们?毕竟,我们绞尽脑汁搞出embedding不仅仅是为了进行数学练习。
所有生产级别的机器学习项目的最终目标是开发机器学习产品并快速将其应用于生产环境。
如今,许多公司正在很多场景中使用嵌入(embedding)技术,基本上涉及了信息检索的各个方面。比如,深度学习模型生成的嵌入正被用于Google Play应用商店推荐系统[1],双重嵌入(dual embeddings)被用于Overstock的产品互补内容推荐功能[2]、Airbnb通过实时排名(real-time ranking)实现搜索结果个性化[3]、Netflix利用嵌入技术进行内容理解(content understanding)[4]、Shutterstock利用嵌入技术进行视觉风格理解[5]等。
01 Pinterest
Pinterest就是一个值得关注的嵌入应用案例。Pinterest是一款应用程序,有许多内容需要向用户进行个性化推荐和分类,特别是首页和购物这两个界面。由于所生成内容的规模非常庞大——每月有3.5亿活跃用户和20亿条内容(Pins 或者用文字描述图片的卡片),因此需要一个强有力的内容过滤和排序策略(filtering and ranking policy)。
为了更好地表示用户的兴趣并呈现有趣的内容,Pinterest开发了PinnerSage [6]。PinnerSage通过多个256维度的嵌入来表示用户的代表性对象,这些嵌入基于相似度(similarit
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



