论文翻译:Two-Stream 3D Convolutional Neural Network for Human Skeleton-Based Action Recognition

本文提出了一种两流三维卷积神经网络模型,用于人体骨架基的动作识别。通过将骨骼关节映射到三维空间并分别编码时空信息,结合3D CNN,该方法能有效提取时空特征,提高识别性能,并对噪声具有鲁棒性。实验在SmartHome和NTU RGB-D数据集上展示了优越的性能。

       摘要:在三维人体动作识别中,如何有效地从骨骼序列中提取时空信息仍然是一个挑战。虽然最近的动作识别方法是基于递归神经网络的,表现出了突出的性能,但这些方法的缺点之一是倾向于过分强调时间信息。由于三维卷积神经网络(3D CNN)是一种通过获取三维信号之间的相关性,同时从空间和时间维度学习特征的强大工具,本文提出了据我们所知,这是3D CNN在基于骨架的动作识别中的第一次应用。我们的方法包括三个阶段。首先将骨骼关节映射到三维坐标空间中,然后分别对其进行时空信息编码。其次,分别采用3D CNN模型,从两个流中提取深层特征。第三,为了增强深度特征捕捉全球关系的能力,我们将每个流扩展为多时间版本。广泛的实验SmartHome数据集和大规模NTU RGB-D数据集表明,我们的方法优于大多数基于rnnn的方法,验证了空间和时间信息的互补性和对噪声的鲁棒性。

        动作识别在智能监控[1]、人机交互[2]、视频分析[3]等应用中得到了广泛的应用。3 -与2d RGB视频相比,人类动作的D表示提供了更全面和更有区别性的信息。近年来,基于骨骼的3D动作识别由于其高水平的表现以及对外观和周围干扰[4]、[5]、[6]、[7]的鲁棒性,越来越受到人们的关注最近,递归神经网络(RNN)的模型和长-短期记忆(LSTM)神经元[8]、[9]被用来建模骨架序列[10]的时间演化。这些基于rnnn的方法往往会过度强调时间信息[11]。然而,最有效的行动识别需要时空信息的结合。考虑到3D卷积神经网络通过执行3D卷积[12]作为动作识别、目标识别[13]、车辆检测[14]和人体姿态估计[15]接收三维输入的自然而合适的选择。因此,该本文提出了一种新的两流三维CNN模型,旨在同时增强空间和时间信息。首先,我们使用Liu等人[16]提出的基于序列的转换方法,消除了视图变化的影响。进一步,将每个动作序列转换后的骨架关节映射到三维坐标空间中。其次,为了便于三维CNN学习鲁棒性特征,将骨骼关节分别编码为空间体积和时间体积通过编码空间和时间信息。第三,twostream 3D CNN在较好的时间尺度上分别捕捉时空信息,增强了时空特征。最后,我们将原始骨架序列转化为多时间序列,以获取大规模的时间

要获取“Electroencephalography-based emotion recognition using a dual-stream multi-scale spatiotemporal convolutional capsule network”这篇论文的PDF文件,可尝试以下途径: 1. **学术数据库**:访问常见的学术数据库,如IEEE Xplore、ACM Digital Library、ScienceDirect、SpringerLink等。很多高校和科研机构会购买这些数据库的使用权,你可以通过所在机构的网络登录这些数据库进行搜索和下载。 2. **预印本平台**:像arXiv等预印本平台可能会有该论文的预印本版本,可直接在上面搜索论文标题尝试获取。 3. **谷歌学术**:使用谷歌学术搜索该论文标题,谷歌学术会提供论文的相关引用信息和可能的下载链接。有些链接会直接指向论文的PDF文件,有些则会指向发表该论文的期刊或会议网站。 4. **作者个人主页**:在搜索引擎中输入作者的姓名,查找他们的个人主页,作者可能会在自己的主页上分享论文的PDF文件。 5. **联系作者**:通过论文中提供的作者邮箱,礼貌地向作者请求提供论文的PDF文件。 ### 代码示例 以下是使用Python的`selenium`库模拟在谷歌学术上搜索该论文的示例代码: ```python from selenium import webdriver from selenium.webdriver.common.by import By import time # 设置Chrome浏览器驱动路径 driver_path = 'path/to/chromedriver' driver = webdriver.Chrome(executable_path=driver_path) # 打开谷歌学术 driver.get('https://scholar.google.com/') # 定位搜索框并输入论文标题 search_box = driver.find_element(By.NAME, 'q') search_box.send_keys('Electroencephalography-based emotion recognition using a dual-stream multi-scale spatiotemporal convolutional capsule network') # 提交搜索 search_box.submit() # 等待页面加载 time.sleep(5) # 查找搜索结果中的链接 results = driver.find_elements(By.CSS_SELECTOR, 'h3.gs_rt a') for result in results: print(result.text) print(result.get_attribute('href')) # 关闭浏览器 driver.quit() ``` ### 相关问题 1. 双流多尺度时空卷积胶囊网络在脑电图情绪识别中的优势有哪些? 2. 除了脑电图,还有哪些生物信号可用于情绪识别? 3. 该论文中提出的情绪识别方法在不同数据集上的表现如何? 4. 时空卷积胶囊网络与传统卷积神经网络在脑电图情绪识别上有何差异? 5. 如何评估基于脑电图的情绪识别系统的性能?
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值