- 博客(216)
- 收藏
- 关注
原创 IJCAI-2024 扩散模型(Diffusion Model)相关论文(16篇)
文章解读: http://www.studyai.com/xueshu/paper/detail/0f87d4365f文章链接:(10.24963/ijcai.2024/527)文章解读: http://www.studyai.com/xueshu/paper/detail/1f51a405d8文章链接:(10.24963/ijcai.2024/282)文章解读: http://www.studyai.com/xueshu/paper/detail/3ec7265b81文章链接:(10.24963/ijca
2024-11-09 20:10:55
935
原创 ACMMM-2024 扩散模型(Diffusion Model)相关论文(43篇)
文章解读: http://www.studyai.com/xueshu/paper/detail/00f3f99f27文章链接: (https://openreview.net/forum?id=jnQFcUU9Bw)文章解读: http://www.studyai.com/xueshu/paper/detail/0866ce41ef文章链接: (https://openreview.net/forum?id=NQPJYEyiiM)文章解读: http://www.studyai.com/xueshu/pa
2024-11-09 20:09:31
998
原创 AAAI-2024 扩散模型(Diffusion Model)相关论文(65篇)
文章解读: http://www.studyai.com/xueshu/paper/detail/008af89b52文章链接:(10.1609/aaai.v38i4.28147)文章解读: http://www.studyai.com/xueshu/paper/detail/027b58e670文章链接:(10.1609/aaai.v38i16.29773)文章解读: http://www.studyai.com/xueshu/paper/detail/0cd849213a文章链接:(10.1609/aa
2024-11-09 20:08:03
1501
1
原创 CVPR-2024 扩散模型(Diffusion Model)相关论文 PART2(72篇)
文章解读: http://www.studyai.com/xueshu/paper/detail/847f6a4bf6文章链接: (https://openaccess.thecvf.com/content/CVPR2024/html/Sueyoshi_Predicated_Diffusion_Predicate_Logic-Based_Attention_Guidance_for_Text-to-Image_Diffusion_Models_CVPR_2024_paper.html)文章解读: http:
2024-11-09 20:06:22
1073
原创 CVPR-2024 扩散模型(Diffusion Model)相关论文 PART1(83篇)
文章解读: http://www.studyai.com/xueshu/paper/detail/00af847b59文章链接: (https://openaccess.thecvf.com/content/CVPR2024/html/Sharma_Alchemist_Parametric_Control_of_Material_Properties_with_Diffusion_Models_CVPR_2024_paper.html)文章解读: http://www.studyai.com/xueshu/
2024-11-09 20:04:47
1474
1
原创 ICRA-2024 三维点云(3D Point Cloud)相关论文
文章解读: http://www.studyai.com/xueshu/paper/detail/01d114c7fd文章链接:(10.1109/ICRA57147.2024.10610810)文章解读: http://www.studyai.com/xueshu/paper/detail/120fc8590d文章链接:(10.1109/ICRA57147.2024.10611238)文章解读: http://www.studyai.com/xueshu/paper/detail/7705d0d44a文章链
2024-10-25 22:25:49
486
原创 ACMMM-2024 三维点云(3D Point Cloud)相关论文
文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接:
2024-10-25 22:24:26
596
原创 AAAI-2024 三维点云(3D Point Cloud)相关论文
文章解读: http://www.studyai.com/xueshu/paper/detail/1a24e662a0文章链接:(10.1609/aaai.v38i19.30099)文章解读: http://www.studyai.com/xueshu/paper/detail/21a009e056文章链接:(10.1609/aaai.v38i2.27944)文章解读: http://www.studyai.com/xueshu/paper/detail/2be70ce894文章链接:(10.1609/aa
2024-10-25 22:23:08
992
原创 TPAMI-2024 三维点云(3D Point Cloud)相关论文
文章解读: http://www.studyai.com/xueshu/paper/detail/5e1f7e0cb6文章链接:(10.1109/TPAMI.2024.3373693)文章解读: http://www.studyai.com/xueshu/paper/detail/72cbecb6c5文章链接:(10.1109/TPAMI.2023.3319448)文章解读: http://www.studyai.com/xueshu/paper/detail/c242bf8023文章链接:(10.1109
2024-10-25 22:22:12
286
原创 CVPR-2024 三维点云(3D Point Cloud)相关论文
文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接:
2024-10-25 22:20:53
3211
原创 CVPR-2024 舞蹈生成(Dance Generation)相关论文
文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接:
2024-10-17 00:23:25
497
原创 TMultimedia-2024 视频生成(Video Generation)相关论文4篇
文章解读: http://www.studyai.com/xueshu/paper/detail/0d192f057e文章链接:(10.1109/TMM.2023.3262972)文章解读: http://www.studyai.com/xueshu/paper/detail/442c8cda8e文章链接:(10.1109/TMM.2024.3362149)文章解读: http://www.studyai.com/xueshu/paper/detail/4b1184255b文章链接:(10.1109/TMM
2024-10-16 23:23:37
250
原创 ACMMM-2024 视频生成(Video Generation)相关论文6篇
文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接:
2024-10-16 23:01:29
522
原创 AAAI-2024 视频生成(Video Generation)相关论文7篇
文章解读: http://www.studyai.com/xueshu/paper/detail/29696cd360文章链接:(10.1609/aaai.v38i5.28206)文章解读: http://www.studyai.com/xueshu/paper/detail/36de59fd34文章链接:(10.1609/aaai.v38i5.28277)文章解读: http://www.studyai.com/xueshu/paper/detail/4d47262076文章链接:(10.1609/aaa
2024-10-16 22:51:23
983
原创 CVPR-2024 视频生成(Video Generation)相关论文
文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接:
2024-10-16 22:37:20
2147
原创 ACMMM-2024 卫星遥感图像相关论文14篇
文章解读: http://www.studyai.com/xueshu/paper/detail/1309bf5fd0文章链接: (https://openreview.net/forum?id=YTNN0mOPQN)With the increasing spatial and temporal resolutions of obtained remote sensing (RS) images, effective compression becomes critical for storage, tr
2024-10-15 08:11:57
719
原创 ICLR-2024 卫星遥感图像相关论文7篇
文章解读: http://www.studyai.com/xueshu/paper/detail/0dbc1e9737文章链接: (https://openreview.net/forum?id=w9tc699w3Z)We introduce a method to train vision-language models for remote-sensing images without using any textual annotations.Our key insight is to use co
2024-10-15 08:00:59
867
原创 AAAI-2024-卫星遥感图像相关论文 20篇
文章解读: http://www.studyai.com/xueshu/paper/detail/2deb4c9ca3文章链接: (10.1609/aaai.v38i8.28710)High-dimensional images, known for their rich semantic information, are widely applied in remote sensing and other fields.The spatial information in these images re
2024-10-14 23:59:32
1335
原创 TPAMI-2024-卫星遥感图像相关论文 8篇
文章解读: http://www.studyai.com/xueshu/paper/detail/0aac21de6b文章链接: (10.1109/TPAMI.2024.3378777)With vigorous development e.g., in autonomous driving and remote sensing, oriented object detection has gradually been featured.The majority of existing methods d
2024-10-14 23:43:58
1299
原创 CVPR-2024-卫星遥感图像相关论文 16篇
文章解读: http://www.studyai.com/xueshu/paper/detail/00ffce4794文章链接: (https://openaccess.thecvf.com/content/CVPR2024/html/Kuckreja_GeoChat_Grounded_Large_Vision-Language_Model_for_Remote_Sensing_CVPR_2024_paper.html)Recent advancements in Large Vision-Language
2024-10-14 23:32:08
2200
原创 TMultimedia-2024 三维人体姿态(3D Human Pose)相关论文4篇
文章解读: http://www.studyai.com/xueshu/paper/detail/1314d395cb文章链接: (10.1109/TMM.2023.3321438)Transformers have been used for 3D human pose estimation with excellent performance; however, most transformers focus on encoding the global spatio-temporal correla
2024-10-13 11:35:54
578
原创 AAAI-2024 三维人体姿态(3D Human Pose)相关论文5篇
文章解读: http://www.studyai.com/xueshu/paper/detail/240d7ca15d文章链接: (10.1609/aaai.v38i7.28549)Most Graph Convolutional Networks based 3D human pose estimation (HPE) methods were involved in single-view 3D HPE and utilized certain spatial graphs, existing key
2024-10-13 11:33:37
832
原创 CVPR-2024 三维人体姿态(3D Human Pose)相关论文10篇
文章解读: http://www.studyai.com/xueshu/paper/detail/2a3f36ffd0文章链接: (https://openaccess.thecvf.com/content/CVPR2024/html/Liao_Multiple_View_Geometry_Transformers_for_3D_Human_Pose_Estimation_CVPR_2024_paper.html)In this work we aim to improve the 3D reasonin
2024-10-13 11:30:41
2304
1
原创 mysql source 导入sql文件报错 ERROR: Unknown command ‘\\‘.
Windows系统中 mysql 命令行客户端默认以gbk编码连接数据库,之前导出备份文件是utf8编码,编码不一致导致错误。以utf8 或 utf8mb4 编码连接,就行了。
2024-10-12 19:59:33
558
原创 TNNLS 2024 综述论文一览 Part2(10篇)(IEEE Transactions on Neural Networks and Learning Systems)
该研究综述了深度学习和NOMA技术在通信系统中的广泛应用,并探索了它们在5G通信中的各种应用。论文《A Review of Nuclei Detection and Segmentation on Microscopy Images Using Deep Learning With Applications to Unbiased Stereology Counting》主要回顾了最新的深度学习方法在细胞(核)检测和分割中的应用,特别是在癌症和阿尔茨海默病的研究中,并强调了结合无偏立体学的深度学习方法。
2024-09-30 11:24:14
1073
原创 TNNLS 2024 综述论文一览 Part1(10篇)(IEEE Transactions on Neural Networks and Learning Systems)
DRL的研究主要集中在几个方面:基于值函数的方法(如深度Q网络DQN)、基于策略的方法(如信任区域策略优化TRPO和异步优势演员评论A3C)、以及结合了多种技术的综合方法(如Rainbow算法)。元学习方法通过元学习范式生成任务,而迁移学习方法则先在丰富数据的基类上训练模型,再在少量标注的新类别上进行微调。TL可以分为四种类型:传递学习、归纳学习、无监督学习和负迁移学习,每种类型又可以进一步细分为四种学习类型:基于实例的学习、基于特征的学习、基于参数的学习和基于关系的学习。
2024-09-30 09:56:42
1364
原创 TPAMI 2024 综述论文一览 Part2(11篇)(IEEE Transactions on Pattern Analysis and Machine Intelligence)
该文章探讨了区块链数据挖掘的潜力,指出其能够揭示匿名参与者的行为模式和系统运行状态,但传统的分析方法由于数据量大、结构复杂而存在处理困难的问题。此外,文章还系统地分析了负采样在图表示学习中的作用,从目标和风险的角度出发,理论上证明了负采样在确定优化目标和结果方差方面的重要性。该综述涵盖了从PGGAN到StyleGAN3的发展历程,并探讨了相关主题,如适合训练的度量标准、不同的潜在表示、GAN到StyleGAN潜在空间的反向映射、人脸图像编辑、跨域人脸风格化、人脸修复以及Deepfake应用。
2024-09-29 22:03:04
1433
原创 TPAMI 2024 综述论文一览 Part1(12篇)(IEEE Transactions on Pattern Analysis and Machine Intelligence)
这篇综述首次全面总结了人体动作生成领域的相关研究工作,介绍了人体运动和生成模型的基础知识,并对三个主流子任务(基于文本、音频和场景驱动的人体动作生成)进行了详细探讨。文章指出,尽管静态点云数据提供了丰富的场景和对象信息,但在许多实际应用中,如自动驾驶和机器人操作,需要考虑时间维度,因此引入了四维数据。《半监督和无监督深度视觉学习:综述》由德国蒂宾根大学发布,涵盖了322篇文献,从统一的角度综述了视觉识别领域的半监督学习(SSL)和无监督学习(UL)深度学习算法。
2024-09-29 18:43:30
2447
原创 论文解读 CVPR-2024 PoseIRM: Enhance 3D Human Pose Estimation on Unseen Camera Settings via Invariant Ris
论文《PoseIRM: Enhance 3D Human Pose Estimation on Unseen Camera Settings via Invariant Risk Minimization》主要介绍了一种名为PoseIRM的新方法,用于在不同相机设置下准确估计三维人体姿态。该方法通过使用合成数据和智能训练策略,即使在未见过的相机设置下也能表现出色。该研究的一个关键挑战是如何生成足够的合成样本以防止模型过拟合。为了应对这一挑战,研究者提出了在大量新的相机设置下人工合成2D-3D姿态对的方法。
2024-09-28 19:27:22
833
原创 论文解读(CVPR-2024) FinePOSE: Fine-Grained Prompt-Driven 3D Human Pose Estimation via Diffusion Models
元优化在提高域泛化能力中的作用主要体现在通过元学习方法来提升模型在不同任务和环境中的适应性和泛化能力。此外,该研究还指出,传统的域泛化方法通常利用对抗训练生成合成姿势进行训练,而本文提出的框架则通过引入双增强器和元优化来实现更有效的泛化。例如,通过结构化任务的算法和数据增强技术,可以克服任务过拟合的问题,从而提高模型在新任务上的表现。:现有的三维人体姿态估计器通常在单个数据集上表现较好,但受限于训练数据姿态结构的单一性,其在跨域实验上的泛化性不足。:现有的多视图方法局限于固定的相机姿态,因此缺乏泛化能力。
2024-09-28 19:25:06
1321
1
原创 论文解读(CVPR-2024) MVGFormer: Multiple View Geometry Transformers for 3D Human Pose Estimation
论文《Multiple View Geometry Transformers for 3D Human Pose Estimation》主要探讨了如何利用多视角几何信息来提升Transformer在三维人体姿态估计中的表现。这项研究由多伦多大学、东南大学和微软联合提出,并将在CVPR 2024会议上发表。该论文的核心贡献在于提出了一种名为MVGFormer的混合模型,该模型结合了几何模块和外观模块。几何模块是无参可微的,有助于泛化;而外观模块则是可学习的,有助于提高精度。
2024-09-28 19:22:36
1282
原创 [论文解读(CVPR-2024)] KTPFormer: Kinematics and Trajectory Prior Knowledge-Enhanced Transformer for 3D H
2.1.KTPFormer利用Transformer架构,并特别强调了动力学和轨迹先验知识的重要性。这些先验知识包括人体骨骼结构的信息和关节运动的物理规律[14][15]。这种方法克服了现有基于Transformer的3D人体姿态估计方法的一个主要弱点:即自注意力机制中Q、K、V向量的生成过程。具体来说,KTPFormer利用先验知识产生Q、K、V向量,这两个模块使KTPFormer能够同时建模空间和时间相关性。
2024-09-28 19:17:55
1140
原创 论文解读 [CVPR-2024] Hourglass Tokenizer for Efficient Transformer-Based 3D Human Pose Estimation
论文《Hourglass Tokenizer for Efficient Transformer-Based 3D Human Pose Estimation》主要介绍了一种名为HoT(Hourglass Tokenizer)的框架,用于高效地进行基于Transformer的三维人体姿态估计。该方法由北京大学的研究团队提出,旨在解决现有视频姿态Transformer(VPT)在资源受限设备上的高计算成本问题。HoT框架的核心思想是通过剪枝和恢复Token来提高计算效率。
2024-09-28 19:13:37
1604
原创 论文解读[CVPR-2024] FreeMan: Towards Benchmarking 3D Human Pose Estimation under Real-World Conditions
总结来说,《FreeMan: Towards Benchmarking 3D Human Pose Estimation under Real-World Conditions》这篇论文通过提出一个大规模、多视角的真实世界数据集FreeMan,解决了现有数据集在真实世界条件下的局限性问题,并为3D人体姿态估计的研究提供了重要的资源和支持。1.3.评估基准与测试:FreeMan不仅提供了一个大规模的数据集,还提供了评估基准和跨域测试,以验证算法的有效性和泛化能力[3][7]。
2024-09-28 19:10:47
1441
原创 论文解读(CVPR-2024) FinePOSE: Fine-Grained Prompt-Driven 3D Human Pose Estimation via Diffusion Models
在FinePOSE中,这种模型的应用细节体现在其能够处理单目三维人体姿态估计中的模糊性和遮挡问题,从而减少预测中的不确定性和误差。具体来说,FinePOSE利用扩散模型从嘈杂的初始3D姿态重建正确的3D姿态,这有助于解决由于深度模糊和遮挡引起的不良姿态问题。总结来说,FinePOSE通过结合扩散模型的强大生成能力和深度学习的高效特征提取能力,提供了一种新的视角来解决3D人体姿态估计的问题。这种方法利用了文本提示来指导模型对身体部位的识别和姿态的预测,从而提高了姿态估计的准确性。
2024-09-28 19:07:22
1365
原创 IEEE TNNLS (IEEE Transactions on Neural Networks and Learning Systems) 近九年研究热点追踪
IEEE TNNLS (IEEE Transactions on Neural Networks and Learning Systems) 近九年研究热点追踪
2024-09-27 22:18:22
375
原创 ACM WSDM(International Conference on Web Search and Data Mining)近十年研究热点追踪
ACM WSDM(International Conference on Web Search and Data Mining)近十年研究热点追踪
2024-09-22 11:22:29
243
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人