论文解读《Transformer-Empowered Multi-Modal Item Embedding for Enhanced Image Search in E-commerce》

醒了就刷牙

于 2024-09-19 18:39:30 发布

阅读量885

点赞数 17

CC 4.0 BY-SA版权

分类专栏：论文文章标签： transformer embedding 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/buyaotutou/article/details/142360091

系列文章目录

文章目录

系列文章目录

论文细节理解

In addition, image embedding poses engineering challenges. Due to the large number of products in Shopee’s e commerce platform1 and the need for multiple-replications (Zhang et al. 2018), generating an embedding for each image requires a huge index volume. Furthermore, dealing with multiple images per product requires mapping and deduplication, further increasing engineering complexity.这里面的multiple-replications什么意思？
在这个上下文中，“multiple-replications”指的是在Shopee电商平台上，同一产品可能有多个不同的图像或变体。这些变体可能包括不同的角度、颜色、尺寸或其他特征。由于每种变体都需要生成一个独立的图像嵌入，这会导致需要处理大量的图像数据，从而增加了工程上的复杂性。简单来说，multiple-replications意味着同一产品存在多个不同的图像副本，这对图像嵌入的生成和管理带来了挑战。
深度学习领域，投影层是什么意思？
在深度学习领域，投影层（Projection Layer）通常指的是一种用于将输入数据映射到特定特征空间的神经网络层。它的主要功能包括：
维度转换：投影层可以改变输入数据的维度，例如将高维数据降低到低维空间，或反之。
特征提取：通过学习特定的权重，投影层能够提取输入数据中的重要特征，帮助模型更好地进行分类或回归任务。
对齐特

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。