基于Transformer的GAN服饰推荐模型:解决现有方法难题
在时尚领域,如何为用户提供更精准、多样的服饰搭配推荐一直是研究的热点。传统的生成对抗网络(GAN)在服饰推荐中存在一些问题,而本文提出的基于Transformer的GAN模型为解决这些问题提供了新的思路。
现有GAN方法存在的问题
- 固定数量的输入输出 :现有的GAN方法在训练时使用固定数量的输入和输出项,模型只能处理训练时指定数量的项目。如果要改变这个数量,就需要重新训练模型,这限制了模型的灵活性和适应性。
- 特征处理问题 :现有解决方案要么只使用视觉特征并从生成图像中提取内容属性,要么将文本处理与生成过程分开。这种方法无法保证保留输入项的属性,也不能确保对生成项属性评估的可靠性。
问题定义与表示
假设存在一些项目域 $D = {D_1, \ldots, D_N}$ 和一个包含可变数量项目的项目集域 $S$。每个项目 $I_{i,j} \in D_i$ ($i \in 1 \ldots N$,$j \in 1 \ldots |D_i|$)都与一个视觉图像 $VisI_{i,j}$ 和一个文本描述 $CI_{i,j}$ 相关联。由于项目集的项目数量是可变的,将它们扩展到预定义的最大项目数 $M$,用随机正态噪声 $N = (0, 1)$ 作为占位符。扩展后的项目集 $\hat{S} k$ 可以表示为:
$\hat{S}_k = {S_k, (VisN^k {n+1}, CN^k_{n+1}), \ldots, (VisN^k_M, CN^
超级会员免费看
订阅专栏 解锁全文
192

被折叠的 条评论
为什么被折叠?



