阅读完相关论文自己的理解(二)

    上篇博客主要叙述了ResNetv1/v2两篇经典论文的解析,由于工作需要,需要做关键点检测,那么阅读了关键点的一些文章,现就Pose的经典的三篇论文进行理解:CPM(Convolutional Pose Machines)、StackedHourGlassNetWork、SimPleBaseLine。

1、CPM 

    1  Introduction

    PoseMachine对于学习隐层丰富的空间网络模型,提出了一个序列预测框架。通过将ConvolutionNet 合并到(inCorporated)PoseMachine 中,用来学习图片特征以及依赖于图片的空间模型。并且文中阐述了处理梯度消失的问题,其通过学习一个目标函数实施中间监督的作用,从而补充反向传播的梯度以及调节学习进程。序列化的网络设计:能够学习到代表图片以及图片上下文全局空间的特征;允许全局的关节一起训练;能够有效地处理大的数据集。

    CPM模型的每一个Stage都包含了Belief maps,用于提升更为精确地估计每一个part的位置。并且为了捕获Parts之间更为广泛的交互特征,通过提高较大的感受野来学习更为广泛的空间关系并提高了精度。

    这篇论文主要创新在于2点。:(1)通过一个由卷积层构建的序列模型学习到了隐层空间模型。(2)一个系统的方法训练,并学习了图片以及依赖图片的空间模型。

    2  Pose Machines

    Pose Machine包含了一系列的多层预测器,用来训练并预测得到每一部分的位置。如下图所示,Pose Machines主要包含(a)和(b),其对应的网络结构为(c)和(d),在每个阶段之后,网络使用了一个防止训练过程中出现梯度消失的中间损失层来进行局部监督。并且(e)图显示了有效地感受野使得模型能够有效的捕捉大范围的空间依赖信息。

2  Sequential Prediction with Learned Spatial Context Features

    在检测比较难得关节的时候,较容易的关节将会提供较为强的线索,随后的Stage可以使用前面的得到的空间信息,用来提高检测性能。较大的感兴趣区域可以通过以下三种方法得到。(1)以消耗精度为代价的Pooling;(2)以增加模型参数为代价提高卷积核的Kernel Size;(3)以可能在训练过程中出现梯度消失的问题上,增加卷积层的数量。该文通过重复相同的Stage,来使得空间上下文依赖于图像。通过加大感兴趣区域的Size,提高了定位精度,这表明了该网络的确编码了parts之间广泛的交互,并且其还是有益的。

CPM优点:(1)Address vanishing gradients:通过中间监督,补充了每一个Stage的梯度,防止梯度下降。(2)能够端到端的训练。

<think>嗯,用户现在问的是文献阅读理解会遇到什么困难。让我先回忆一下之前的对话。之前他问的是关于他的毕设题目,基于MATLAB的智能泊车算法仿真的汇报框架,我已经帮他设计了一个结构。现在他可能在进行文献综述阶段,遇到了困难,所以想了解常见的挑战。 首先,我需要确定用户的具体需求。他可能刚开始做文献综述,或者在过程中遇到了问题,想了解可能的困难以便提前应对。作为学生,尤其是做毕业设计的时候,文献阅读是基础,但也是容易卡壳的地方。因此,用户可能希望了解常见的困难,以及如何解决它们,从而更高效地进行文献调研。 接下来,我要考虑文献阅读理解中常见的困难有哪些。比如,如何找到高质量的文献,如何管理大量的文献,如何理解复杂的方法和理论,英语阅读障碍,如何批判性分析文献,以及整合不同研究的观点等。这些都是学生在文献阅读中常遇到的问题。 另外,用户可能还面临时间管理的问题,比如如何在有限的时间内高效阅读大量文献。或者,他可能对某个特定领域的术语不熟悉,导致理解困难。此外,如何判断文献的相关性和重要性也是挑战之一,尤其是当面对大量搜索结果时。 还要考虑用户可能的背景。他使用的是MATLAB进行仿真,可能更偏向工程或计算机科学,所以相关领域的文献可能涉及算法、控制理论、车辆动力学等。这些领域的文献可能包含数学公式和专业术语,对初学者来说理解起来有难度。 此外,用户可能在文献综述时需要将不同研究的方法和结果进行比较,找出自己研究中的创新点或改进方向,这需要深入理解每篇文献的贡献和不足。因此,如何有效地总结和对比文献也是一个挑战。 最后,用户可能需要一些实际的建议来克服这些困难,比如使用文献管理工具,如何做笔记,如何提高英语阅读能力,或者如何向导师和同学寻求帮助。这些实用的技巧会比单纯列举困难更有帮助。 总结来说,用户的需求是了解文献阅读中的常见困难以及应对策略,以便更好地进行毕设的文献综述部分。我需要将这些困难分门别类,并给出对应的解决方法,帮助用户系统性地应对挑战。</think>文献阅读理解是科研工作的基础,但过程中常会遇到以下困难及应对建议,供你参考: --- ### **一、文献获取阶段的困难** 1. **文献质量参差不齐** - **问题**:如何筛选高价值文献?预印本平台(如arXiv)论文未经验证,期刊会议水平差异大。 - **建议**: - 优先阅读领域顶刊/顶会论文(如IEEE Transactions、CVPR等)。 - 通过引用量、作者声誉、机构背景辅助判断。 2. **检索效率低** - **问题**:关键词选择不当导致漏检或冗余。 - **建议**: - 使用组合关键词(如“automatic parking + path planning + MATLAB”)。 - 利用Google Scholar的“相关文献”推荐功能,或工具如Connected Papers(https://www.connectedpapers.com)追溯关联研究。 --- ### **、文献阅读阶段的困难** 1. **专业术语与数学公式障碍** - **问题**:对车辆运动学模型、控制理论(如MPC)的数学推导难以理解- **建议**: - 结合教材(如《车辆动力学与控制》《机器人学中的状态估计》)补充基础知识。 - 用MATLAB复现论文中的公式推导(例如运动学模型代码化)。 2. **英语阅读压力** - **问题**:长难句、学术表达习惯影响理解速度。 - **建议**: - 工具辅助:DeepL翻译划词阅读,但需结合原文避免歧义。 - 重点读摘要、引言、结论,再深入方法和实验。 3. **逻辑碎片化** - **问题**:论文内容跳跃性强,难以串联整体思路。 - **建议**: - 边读边画思维导图,标注“问题→方法→结果→创新点”逻辑链。 - 对经典论文制作“文献卡片”,总结核心贡献和局限性。 --- ### **三、文献理解阶段的困难** 1. **实验复现与细节缺失** - **问题**:论文省略参数设置或算法实现细节(如RRT*的步长调整策略)。 - **建议**: - 查找作者开源代码(GitHub)或向作者邮件索要补充材料。 - 参考其他论文对同类方法的描述,交叉验证细节。 2. **批判性分析能力不足** - **问题**:容易全盘接受论文结论,忽视潜在缺陷。 - **建议**: - 提问模板: - “实验场景是否覆盖了我的研究需求?(如动态障碍物)” - “对比基线方法是否公平?(如参数是否调优)” - “结论是否过度泛化?” 3. **跨领域知识融合困难** - **问题**:智能泊车涉及控制理论、计算机视觉、车辆工程等多学科知识。 - **建议**: - 建立“最小知识框架”:优先掌握与毕设强相关的子领域(如路径规划算法)。 - 利用综述论文(Survey Paper)快速建立领域全景认知。 --- ### **四、管理文献的困难** 1. **文献数量庞大** - **建议**: - 使用文献管理工具(如Zotero、EndNote),按“规划算法”“控制算法”“仿真平台”分类标签。 - 定期清理低相关度文献,避免信息过载。 2. **笔记难以复用** - **建议**: - 采用标准化笔记模板,例如: ```markdown ## 论文标题 - **问题**:作者解决了什么? - **方法**:核心创新点(与我的毕设关联点) - **不足**:可改进的方向(如未考虑XXX场景) - **复现提示**:MATLAB代码实现的关键步骤 ``` --- ### **五、心理层面的困难** - **“读不”焦虑**:文献海量,时间有限。 - **应对**: - 接受“选择性阅读”:80%精力读20%高价值文献。 - 设定每日目标(如精读1篇+泛读3篇)。 --- ### **六、实用工具推荐** 1. **翻译与速读**:知云文献翻译、ReadPaper(https://readpaper.com)。 2. **公式理解**:Mathpix截图转LaTeX,结合MATLAB符号计算工具箱验证。 3. **笔记管理**:Notion、Obsidian联动Zotero。 --- 通过系统性阅读策略和工具辅助,可以逐步提升文献理解效率。如果需要针对具体论文(如某篇混合A*算法的文献)展开分析,可以进一步讨论!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值