
论文与项目
文章平均质量分 97
记录复现过的项目和看过的论文
小坤兽
vx:w1617530107
展开
-
项目-1.CROSSFORMER论文与代码解析(CrossFormer: A Versatile Vision Transformer Based on Cross-scale Attention)
CROSSFORMER[CV:图像分类、目标检测]1.资源链接1.1论文1.2代码2.论文解析2.0 摘要2.1 基本介绍2.2 背景2.3 本文模型2.3.1 Cross-Scale Embedding Layer(CEL)2.3.2 CrossFormer Block2.3.2.1长短距离注意力机制 (LSDA)2.3.2.2 Dynamic Position Bias(DPB)3.代码解析3.1下载之初3.2环境搭建3.2.0 下载数据集3.2.1图像分类3.2.1.1 环境配置3.2.1.2 修改代原创 2022-02-15 15:25:37 · 4214 阅读 · 1 评论 -
项目-2.EVP论文与代码解析(Audio-Driven Emotional Video Portraits)
EVP[]CV:音视频转换1.资源链接1.1 论文1.2 代码2.论文解析3.代码复现4.代码解析5.个人总结1.资源链接1.1 论文(Audio-Driven Emotional Video Portraits)[https://arxiv.org/abs/2104.07452]1.2 代码2.论文解析3.代码复现4.代码解析5.个人总结摘要 尽管之前在生成音频驱动的说话人脸方面取得了成功,但之前的大多数研究都集中在语音内容与嘴形之间的相关性上。 面部情感是自然人脸上最重要的特征原创 2022-02-28 10:27:10 · 5571 阅读 · 9 评论