- 博客(759)
- 资源 (4)
- 收藏
- 关注
原创 【AI视野·今日CV 计算机视觉论文速览 第304期】Thu, 7 Mar 2024
AI视野·今日CS.CV 计算机视觉论文速览Thu, 7 Mar 2024Totally 67 papers👉上期速览✈更多精彩请移步主页Daily Computer Vision PapersDART: Implicit Doppler Tomography for Radar Novel View Synthesis Authors Tianshu Huang, John Miller, Akarsh Prabhakara, Tao Jin, Tarana Laroia, Zic
2024-03-08 00:18:23
1773
1
原创 【AI视野·今日NLP 自然语言处理论文速览 第八十四期】Thu, 7 Mar 2024
AI视野·今日CS.NLP 自然语言处理论文速览Thu, 7 Mar 2024Totally 52 papers👉上期速览✈更多精彩请移步主页Daily Computation and Language PapersThe Heuristic Core: Understanding Subnetwork Generalization in Pretrained Language Models Authors Adithya Bhaskar, Dan Friedman, Danqi
2024-03-08 00:14:58
2488
原创 【AI视野·今日Robot 机器人论文速览 第八十四期】Thu, 7 Mar 2024
AI视野·今日CS.Robotics 机器人学论文速览Thu, 7 Mar 2024Totally 23 papers👉上期速览✈更多精彩请移步主页Daily Robotics Papers3D Diffusion Policy Authors Yanjie Ze, Gu Zhang, Kangning Zhang, Chenyuan Hu, Muhan Wang, Huazhe Xu模仿学习提供了一种教授机器人灵巧技能的有效方法,然而,稳健且普遍地学习复杂技能通常需要大量的人类演示
2024-03-08 00:13:54
1785
原创 【AI视野·今日Sound 声学论文速览 第五十四期】Thu, 7 Mar 2024
这项工作开创了自动估计录音中音乐作品的演奏难度的先河,有两个精确的贡献:第一个基于音频的难度估计数据集,即钢琴教学大纲 PSyllabus 数据集,包含来自 1,233 名作曲家的 11 个难度级别的 7,901 首钢琴曲,以及一个识别框架能够管理直接从音频派生的单模态和多模态方式的不同输入表示,以执行难度估计任务。相反,对合作伙伴的最后一个音符做出反应并尝试与其和谐预测策略对协调的策略会产生最低的非控制收益和最高的标准偏差,这表明根据对合作伙伴玩家的即时反应来选择音符可能会产生不一致的结果。
2024-03-08 00:12:55
1278
原创 【AI视野·今日CV 计算机视觉论文速览 第303期】Wed, 6 Mar 2024
AI视野·今日CS.CV 计算机视觉论文速览Wed, 6 Mar 2024Totally 85 papers👉上期速览✈更多精彩请移步主页Daily Computer Vision PapersFAR: Flexible, Accurate and Robust 6DoF Relative Camera Pose Estimation Authors Chris Rockwell, Nilesh Kulkarni, Linyi Jin, Jeong Joon Park, Justin
2024-03-06 15:43:55
2019
原创 【AI视野·今日NLP 自然语言处理论文速览 第八十三期】Wed, 6 Mar 2024
AI视野·今日CS.NLP 自然语言处理论文速览Wed, 6 Mar 2024Totally 74 papers👉上期速览✈更多精彩请移步主页Daily Computation and Language PapersMAGID: An Automated Pipeline for Generating Synthetic Multi-modal Datasets Authors Hossein Aboutalebi, Hwanjun Song, Yusheng Xie, Arshi
2024-03-06 15:42:21
1784
原创 【AI视野·今日Robot 机器人论文速览 第八十三期】Wed, 6 Mar 2024
AI视野·今日CS.Robotics 机器人学论文速览Wed, 6 Mar 2024Totally 30 papers👉上期速览✈更多精彩请移步主页Daily Robotics PapersA Safety-Critical Framework for UGVs in Complex Environments: A Data-Driven Discrepancy-Aware Approach Authors Skylar X. Wei, Lu Gan, Joel W. Burdick
2024-03-06 15:41:03
1260
原创 【AI视野·今日Sound 声学论文速览 第五十三期】Wed, 6 Mar 2024
据我们所知,我们的两项比赛都是同类比赛中的首创,并且比赛之间的联系随着时间的推移相互提高参赛作品的质量,这使得这些比赛成为代表更广泛的游戏社区中经常被忽视的细分市场的重要组成部分,VIP。将带后置滤波和不带后置滤波的信号处理方法以及卷积循环神经网络 CRNN 方法与基于 TSE 模型的最先进的说话人识别方法进行比较,我们发现不带后置滤波的信号处理方法在 Word 方面产生了最佳性能低混响的重叠语音信号的错误率,而 CRNN 方法对于混响更加鲁棒。在我们的工作中,我们专注于带有伪标签的半监督 AVSL。
2024-03-06 15:40:10
540
原创 【AI视野·今日Sound 声学论文速览 第五十二期】Tue, 5 Mar 2024
AI视野·今日CS.Sound 声学论文速览Tue, 5 Mar 2024Totally 18 papers👉上期速览✈更多精彩请移步主页Daily Sound PapersSA-SOT: Speaker-Aware Serialized Output Training for Multi-Talker ASR Authors Zhiyun Fan, Linhao Dong, Jun Zhang, Lu Lu, Zejun Ma多方自动语音识别在会议、对话等涉及多方交互的场景中发挥着
2024-03-06 11:10:30
580
原创 【AI视野·今日Robot 机器人论文速览 第八十二期】Tue, 5 Mar 2024
AI视野·今日CS.Robotics 机器人学论文速览Tue, 5 Mar 2024Totally 63 papers👉上期速览✈更多精彩请移步主页Daily Robotics PapersTwisting Lids Off with Two Hands Authors Toru Lin, Zhao Heng Yin, Haozhi Qi, Pieter Abbeel, Jitendra Malik用两只多指手操纵物体一直是机器人技术中长期存在的挑战,这归因于许多操纵任务的接触丰富性
2024-03-06 11:08:54
1727
原创 【AI视野·今日NLP 自然语言处理论文速览 第八十二期】Tue, 5 Mar 2024
AI视野·今日CS.NLP 自然语言处理论文速览Tue, 5 Mar 2024 (showing first 100 of 175 entries)Totally 100 papers👉上期速览✈更多精彩请移步主页Daily Computation and Language PapersKey-Point-Driven Data Synthesis with its Enhancement on Mathematical Reasoning Authors Yiming Huang
2024-03-06 11:08:08
1656
原创 【AI视野·今日CV 计算机视觉论文速览 第302期】Tue, 5 Mar 2024
AI视野·今日CS.CV 计算机视觉论文速览Tue, 5 Mar 2024Totally 177 papers👉上期速览✈更多精彩请移步主页Daily Computer Vision PapersBrand Visibility in Packaging: A Deep Learning Approach for Logo Detection, Saliency-Map Prediction, and Logo Placement Analysis Authors Alireza H
2024-03-06 11:06:38
2473
原创 【AI视野·今日CV 计算机视觉论文速览 第301期】Mon, 4 Mar 2024
AI视野·今日CS.CV 计算机视觉论文速览Mon, 4 Mar 2024Totally 74 papers👉上期速览✈更多精彩请移步主页Daily Computer Vision PapersPoint Could Mamba: Point Cloud Learning via State Space Model Authors Tao Zhang, Xiangtai Li, Haobo Yuan, Shunping Ji, Shuicheng Yan在这项工作中,我们首次证明基于
2024-03-04 20:50:50
1489
原创 【AI视野·今日NLP 自然语言处理论文速览 第八十一期】Mon, 4 Mar 2024
AI视野·今日CS.NLP 自然语言处理论文速览Mon, 4 Mar 2024Totally 48 papers👉上期速览✈更多精彩请移步主页Daily Computation and Language PapersMitigating Reversal Curse via Semantic-aware Permutation Training Authors Qingyan Guo, Rui Wang, Junliang Guo, Xu Tan, Jiang Bian, Yuji
2024-03-04 20:49:46
1792
原创 【AI视野·今日Robot 机器人论文速览 第八十一期】Mon, 4 Mar 2024
AI视野·今日CS.Robotics 机器人学论文速览Mon, 4 Mar 2024Totally 25 papers👉上期速览✈更多精彩请移步主页Daily Robotics PapersRobust Online Epistemic Replanning of Multi-Robot Missions Authors Lauren Bramblett, Branko Miloradovic, Patrick Sherman, Alessandro V. Papadopoulos,
2024-03-04 20:48:25
1192
原创 【AI视野·今日Sound 声学论文速览 第五十一期】Mon, 4 Mar 2024
在本文中,我们提出了 VoxGenesis,一种新颖的无监督语音合成框架,可以在没有监督的情况下发现潜在的说话人流形和有意义的语音编辑方向。我们进行了大量的实验,使用主观和客观指标来评估所提出的 VoxGenesis,发现它比以前的方法产生了更加多样化和现实的、具有独特特征的扬声器。通过并行适配器设计,我们提出的框架将两种类型的适配器插入到预先训练的模型中,从而允许调整中间 Transformer 层中的潜在特征和所有 Transformer 层的输出嵌入。在评估技术中,窄频带具有显着的影响。
2024-03-04 20:46:56
883
原创 【AI视野·今日Sound 声学论文速览 第五十期】Fri, 1 Mar 2024
与使用原始的以视觉为中心的描述相比,我们获得以音频为中心的描述的方法提供了显着更高的零镜头性能。此外,我们表明,与使用数据集的原始音频类标签相比,使用相同的提示,我们可以成功地利用 LLM 来改进 EpicSounds 上的检索。我们的实验表明,所提出的方法比基线更好地检测构音障碍语音中的不当停顿。我们在 1 个 Filterbank 到 DSU 和 2 个 DSU 到翻译数据上预训练编码器解码器模型,并使用 1 中的编码器和 2 中的解码器来初始化新模型,并在有限的语音翻译数据上对其进行微调。
2024-03-04 20:43:38
1198
原创 【AI视野·今日Robot 机器人论文速览 第八十期】Fri, 1 Mar 2024
AI视野·今日CS.Robotics 机器人学论文速览Fri, 1 Mar 2024Totally 32 papers👉上期速览✈更多精彩请移步主页Daily Robotics PapersHumanoid Locomotion as Next Token Prediction Authors Ilija Radosavovic, Bike Zhang, Baifeng Shi, Jathushan Rajasegaran, Sarthak Kamat, Trevor Darrell
2024-03-04 20:41:32
1599
原创 【AI视野·今日NLP 自然语言处理论文速览 第八十期】Fri, 1 Mar 2024
AI视野·今日CS.NLP 自然语言处理论文速览Fri, 1 Mar 2024Totally 67 papers👉上期速览✈更多精彩请移步主页Daily Computation and Language PapersLoose LIPS Sink Ships: Asking Questions in Battleship with Language-Informed Program Sampling Authors Gabriel Grand, Valerio Pepe, Jaco
2024-03-04 20:39:51
1874
原创 【AI视野·今日CV 计算机视觉论文速览 第300期】Fri, 1 Mar 2024
AI视野·今日CS.CV 计算机视觉论文速览Fri, 1 Mar 2024Totally 114 papers👉上期速览✈更多精彩请移步主页Daily Computer Vision PapersDistriFusion: Distributed Parallel Inference for High-Resolution Diffusion Models Authors Muyang Li, Tianle Cai, Jiaxin Cao, Qinsheng Zhang, Han C
2024-03-04 20:38:42
2460
原创 【AI视野·今日Robot 机器人论文速览 第七十九期】Thu, 18 Jan 2024
AI视野·今日CS.Robotics 机器人学论文速览Thu, 18 Jan 2024Totally 43 papers👉上期速览✈更多精彩请移步主页Daily Robotics PapersCognitiveDog: Large Multimodal Model Based System to Translate Vision and Language into Action of Quadruped Robot Authors Artem Lykov, Mikhail Litvi
2024-02-14 21:40:43
1439
原创 【AI视野·今日NLP 自然语言处理论文速览 第七十九期】Thu, 18 Jan 2024
AI视野·今日CS.NLP 自然语言处理论文速览Thu, 18 Jan 2024Totally 35 papers👉上期速览✈更多精彩请移步主页Daily Computation and Language PapersDeciphering Textual Authenticity: A Generalized Strategy through the Lens of Large Language Semantics for Detecting Human vs. Machine-Gen
2024-02-14 21:38:39
1861
原创 【AI视野·今日CV 计算机视觉论文速览 第300期】Tue, 30 Jan 2024
AI视野·今日CS.CV 计算机视觉论文速览Tue, 30 Jan 2024Totally 146 papers👉上期速览✈更多精彩请移步主页Daily Computer Vision PapersComputer Vision for Primate Behavior Analysis in the Wild Authors Richard Vogg, Timo L ddecke, Jonathan Henrich, Sharmita Dey, Matthias Nuske, Va
2024-02-14 21:25:54
1800
原创 【AI视野·今日CV 计算机视觉论文速览 第299期】Mon, 29 Jan 2024
AI视野·今日CS.CV 计算机视觉论文速览Mon, 29 Jan 2024Totally 55 papers👉上期速览✈更多精彩请移步主页Daily Computer Vision PapersAnnotated Hands for Generative Models Authors Yue Yang, Atith N Gandhi, Greg TurkGAN 和扩散模型等生成模型已经展示了令人印象深刻的图像生成能力。尽管取得了这些成功,但这些系统在用手创建图像方面却表现得令人惊讶
2024-02-14 21:23:04
1132
原创 【AI视野·今日CV 计算机视觉论文速览 第298期】Fri, 26 Jan 2024
AI视野·今日CS.CV 计算机视觉论文速览Fri, 26 Jan 2024Totally 71 papers👉上期速览✈更多精彩请移步主页Daily Computer Vision PapersMultimodal Pathway: Improve Transformers with Irrelevant Data from Other Modalities Authors Yiyuan Zhang, Xiaohan Ding, Kaixiong Gong, Yixiao Ge,
2024-02-14 21:21:44
1507
原创 【AI视野·今日CV 计算机视觉论文速览 第297期】Thu, 25 Jan 2024
AI视野·今日CS.CV 计算机视觉论文速览Thu, 25 Jan 2024Totally 70 papers👉上期速览✈更多精彩请移步主页Daily Computer Vision PapersAlgebraic methods for solving recognition problems with non-crossing classes Authors Anvar Kabulov, Alimdzhan Babadzhanov, Islambek Saymanov在本文中,我
2024-02-14 21:19:47
1590
原创 【AI视野·今日CV 计算机视觉论文速览 第296期】Wed, 24 Jan 2024
AI视野·今日CS.CV 计算机视觉论文速览Wed, 24 Jan 2024Totally 65 papers👉上期速览✈更多精彩请移步主页Daily Computer Vision PapersGALA: Generating Animatable Layered Assets from a Single Scan Authors Taeksoo Kim, Byungjun Kim, Shunsuke Saito, Hanbyul Joo我们提出了 GALA,这是一个框架,它将单层
2024-02-14 21:16:59
1188
原创 【AI视野·今日CV 计算机视觉论文速览 第295期】Tue, 23 Jan 2024
AI视野·今日CS.CV 计算机视觉论文速览Tue, 23 Jan 2024Totally 134 papers👉上期速览✈更多精彩请移步主页Daily Computer Vision PapersExploring Simple Open-Vocabulary Semantic Segmentation Authors Zihang Lai开放词汇语义分割模型旨在从一组任意开放词汇文本中准确地将语义标签分配给图像中的每个像素。为了学习这种像素级对齐,当前的方法通常依赖于图像级 VL
2024-02-14 21:14:38
1356
原创 【AI视野·今日CV 计算机视觉论文速览 第294】Mon, 22 Jan 2024
AI视野·今日CS.CV 计算机视觉论文速览Mon, 22 Jan 2024Totally 64 papers👉上期速览✈更多精彩请移步主页Daily Computer Vision PapersDepth Anything: Unleashing the Power of Large-Scale Unlabeled Data Authors Lihe Yang, Bingyi Kang, Zilong Huang, Xiaogang Xu, Jiashi Feng, Hengshu
2024-02-14 21:12:26
1245
原创 【AI视野·今日CV 计算机视觉论文速览 第293期】Fri, 19 Jan 2024
AI视野·今日CS.CV 计算机视觉论文速览Fri, 19 Jan 2024Totally 103 papers👉上期速览✈更多精彩请移步主页Daily Computer Vision PapersParaHome: Parameterizing Everyday Home Activities Towards 3D Generative Modeling of Human-Object Interactions Authors Jeonghwan Kim, Jisoo Kim, J
2024-02-14 21:09:50
1122
原创 【AI视野·今日CV 计算机视觉论文速览 第292期】Thu, 18 Jan 2024
AI视野·今日CS.CV 计算机视觉论文速览Thu, 18 Jan 2024Totally 102 papers👉上期速览✈更多精彩请移步主页Daily Computer Vision PapersGARField: Group Anything with Radiance Fields Authors Chung Min Kim, Mingxuan Wu, Justin Kerr, Ken Goldberg, Matthew Tancik, Angjoo Kanazawa分组本质上
2024-02-14 21:07:02
2044
原创 【AI视野·今日Sound 声学论文速览 第四十九期】Wed, 17 Jan 2024
AI视野·今日CS.Sound 声学论文速览Wed, 17 Jan 2024Totally 23 papers👉上期速览✈更多精彩请移步主页Daily Sound PapersFrom Coarse to Fine: Efficient Training for Audio Spectrogram Transformers Authors Jiu Feng, Mehmet Hamza Erol, Joon Son Chung, Arda SenocakTransformer 已成为音
2024-02-14 21:02:37
1250
原创 【AI视野·今日Robot 机器人论文速览 第七十八期】Wed, 17 Jan 2024
AI视野·今日CS.Robotics 机器人学论文速览Wed, 17 Jan 2024Totally 49 papers👉上期速览✈更多精彩请移步主页Daily Robotics PapersSafe Mission-Level Path Planning for Exploration of Lunar Shadowed Regions by a Solar-Powered Rover Authors Olivier Lamarre, Shantanu Malhotra, Jona
2024-02-14 20:59:52
966
原创 【AI视野·今日NLP 自然语言处理论文速览 第七十八期】Wed, 17 Jan 2024
AI视野·今日CS.NLP 自然语言处理论文速览Wed, 17 Jan 2024 (showing first 100 of 163 entries)Totally 100 papers👉上期速览✈更多精彩请移步主页Daily Computation and Language PapersDeductive Closure Training of Language Models for Coherence, Accuracy, and Updatability Authors Afr
2024-02-14 20:56:08
1943
原创 【AI视野·今日CV 计算机视觉论文速览 291期】Wed, 17 Jan 2024
AI视野·今日CS.CV 计算机视觉论文速览Wed, 17 Jan 2024Totally 182 papers👉上期速览✈更多精彩请移步主页Daily Computer Vision PapersMultiPLY: A Multisensory Object-Centric Embodied Large Language Model in 3D World Authors Yining Hong, Zishuo Zheng, Peihao Chen, Yian Wang, Juny
2024-02-14 20:53:52
1568
原创 【AI视野·今日Sound 声学论文速览 第四十八期】Mon, 15 Jan 2024
本文提出了一种基于生成对抗网络 GAN 的 BWE 模型,具有并行预测幅度和相位谱的能力,称为 AP BWE,它实现了高质量和高效的宽带语音波形生成。然而,对于连续语音中的 KWS,协同发音和流式分词很容易为不同的文本产生相似的音频模式,从而可能引发误报。在 SlideSpeech(一个富含幻灯片的大规模视听语料库)上进行的实验表明,我们提出的 LCB 网络在测试集上的 WER U WER B WER 相对减少量优于一般 ASR 模型 9.4 9.1 10.9,具有较高的无偏和有偏性能。
2024-01-31 12:21:19
606
原创 【AI视野·今日Robot 机器人论文速览 第七十七期】Mon, 15 Jan 2024
特别是,通过设计目标接近和感知邻居无碰撞子任务,并将这些子任务纳入约束而不是基于在线约束的优化框架中的传统成本函数,所提出的LTTE可以系统地保证网络中不断变化的环境下的长期目标护航。实验表明,所提出的软臂具有较高的灵活性和较大的工作空间,并且基于所提出的建模方法的算法的跟踪误差比基于基线模型的算法的跟踪误差最多小52。患有多动症的大学生对简单的社交辅助机器人 SAR 做出了积极的反应,这些机器人可以监控注意力并提供非语言反馈,但研究仅在实验室中进行了简短的研究。该运动学模型考虑了手和物体之间的运动。
2024-01-31 12:19:50
886
原创 【AI视野·今日NLP 自然语言处理论文速览 第七十七期】Mon, 15 Jan 2024
AI视野·今日CS.NLP 自然语言处理论文速览Mon, 15 Jan 2024Totally 57 papers👉上期速览✈更多精彩请移步主页Daily Computation and Language PapersMachine Translation Models are Zero-Shot Detectors of Translation Direction Authors Michelle Wastl, Jannis Vamvas, Rico Sennrich检测并行文本
2024-01-31 12:17:10
1669
原创 【AI视野·今日CV 计算机视觉论文速览 第290期】Mon, 15 Jan 2024
AI视野·今日CS.CV 计算机视觉论文速览Mon, 15 Jan 2024Totally 66 papers👉上期速览✈更多精彩请移步主页Daily Computer Vision PapersSeeing the roads through the trees: A benchmark for modeling spatial dependencies with aerial imagery Authors Caleb Robinson, Isaac Corley, Anthon
2024-01-31 12:15:46
1592
原创 【AI视野·今日Sound 声学论文速览 第四十七期】Fri, 12 Jan 2024
受自监督学习最新进展的推动,我们提出了分层对比掩模自编码器 HiCMAE,这是一种新颖的自监督框架,利用对大量未标记的视听数据进行大规模自监督预训练来促进 AVER 的进步。迁移学习 TL 是一种越来越流行的训练深度学习 DL 模型的方法,它利用在多样化的大规模数据集上训练基础模型所获得的知识,用于可用的领域或任务特定数据较少的下游任务。具体来说,我们使用不同的投影仪来学习每个类别的逐帧特征。通过使用所提出的表示,由于对外部辐射的宽松约束,可以显着减少优先方向上的外部辐射,同时保持较高的内部合成精度。
2024-01-29 13:40:19
1040
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人