pontoon-优快云博客

原创论文解读：【CVPR24 Highlight】LangSplat: 3D Language Gaussian Splatting

摘要：清华与哈佛团队提出的LangSplat（CVPR 2024 Highlight）基于3D高斯溅射技术，实现了开放词汇的3D场景交互（如物体定位与分割），解决了现有方法LERF的速度与精度缺陷。通过替换NeRF为高效高斯溅射，LangSplat渲染速度提升199倍；结合SAM的层级分割，消除边界模糊与语义歧义；并设计场景专属自编码器压缩CLIP特征，降低35倍内存开销。实验表明，该方法在语言查询任务中兼具实时性与高精度。关键词： 3D高斯溅射、开放词汇查询、SAM分割、自编码器、实时交互

2025-07-04 07:58:05 1120

原创【CVPR25】LogoSP: Local-global Grouping of Superpoints for Unsupervised Semantic Segmentation of 3D

LogoSP：基于局部-全局超点分组的无监督3D点云语义分割（CVPR 2025 | 港理工）本文提出LogoSP方法，解决现有无监督3D语义分割方法在特征质量和分组策略上的不足。核心创新包括：1）通过2D-3D特征蒸馏模块获取语义先验；2）自下而上的超点生长策略；3）基于图傅里叶变换的全局超点分组方法。具体实现中，首先利用预训练2D模型提取特征并投影到3D点云，然后通过超点生长构建层次结构，最后在频域中分析全局模式生成高质量伪标签。实验表明，该方法在多个基准数据集上优于现有技术，尤其在复杂场景中展现出更

2025-06-30 08:43:20 1179

原创论文解读：【CVPR2025最佳论文】VGGT: Visual Geometry Grounded Transformer

CVPR2025最佳论文奖，来自牛津的VGG实验室。提出了真正的端到端重建： VGGT是一个前馈式（feed-forward）神经网络，仅需一次前向传播，就能在数秒内直接从输入的单张、少量或数百张图像中，一次性预测出场景的全套3D关键属性，包括相机内外参数、深度图、点图和3D点轨迹。

2025-06-30 08:37:41 3925 1

原创论文解读：【NeurIPS 2023】 Bridging the Domain Gap: Self-Supervised 3D Scene Understanding with Foundation

来自NIPS2023，本文提出Bridge3D框架，通过自监督学习弥合3D模型与多模态基础模型之间的领域差距。该框架包含三个核心组件：(1)基于基础模型生成的语义掩码指导3D掩码自编码器，提出前景感知的掩码与补丁丢弃策略；(2)场景级多模态知识蒸馏，利用图像描述生成技术对齐3D点云与文本/图像特征；(3)对象级知识蒸馏，通过解码器重构机制将视觉与文本特征融入3D表示学习。实验表明，该方法在下游任务中优于现有技术，首次实现了多基础模型协同的3D场景理解。相关工作为探索3D与语言/视觉的跨模态学习提供了新思路。

2025-06-30 08:33:50 850

pontoon‘s zone

原创论文解读：【CVPR24 Highlight】LangSplat: 3D Language Gaussian Splatting

原创【CVPR25】LogoSP: Local-global Grouping of Superpoints for Unsupervised Semantic Segmentation of 3D

原创论文解读：【CVPR2025最佳论文】VGGT: Visual Geometry Grounded Transformer

原创论文解读：【NeurIPS 2023】 Bridging the Domain Gap: Self-Supervised 3D Scene Understanding with Foundation

原创论文解读：SAMPro3D: Locating SAM Prompts in 3D for Zero-Shot Scene Segmentation

原创论文解读：Segment3D: Learning Fine-Grained Class-Agnostic 3D Segmentation without Manual Labels

原创论文解读：SAM3D: Segment Anything in 3D Scenes

原创 vscode清除远程连接的本地缓存

原创远程服务器时间慢8小时解决方案

原创 Vscode远程连接服务器终端zsh+Oh-my-zsh + Powerlevel10 + Autosuggestions + Autojump + Syntax-highlighting

原创何凯明新作ViTDET：目标检测领域，颠覆分层backbone理念

原创 soft-nms numpy-python实现软非极大值抑制精简代码

原创 NMS-python-numpy 精简非极大值抑制代码

原创论文解读：GAN与检测网络多任务/SOD-MTGAN: Small Object Detection via Multi-Task Generative Adversarial Network

原创论文解读：跨模态/多光谱/多模态检测 Cross-Modality Fusion Transformer for Multispectral Object Detection

原创论文解读TransFG: A Transformer Architecture for Fine-grained Recognition

原创 python爬虫中requests库和正则表达式之淘宝爬虫实战

空空如也

空空如也