师兄博士答辩有感

下午去听了我们组博士的答辩。第一个挺的是FW的。看了他的PPT 发现自己硕士的PPT 写的很烂。基本上大家一般都有四篇以上的文章,然后每个文章是一个主题,当然也不排除在一个主题下面有多篇文章。他对原有的方法基本上做了一个总结,比如现有的什么方法。每个方法有什么优点。什么缺点(用红色的字体标出来),然后针对这个缺点我们提出了什么方法。来解决这个问题。如果这个问题有多个缺点,然后我们会根据一个缺点来改进。他在每一个PPT的下面都列了自己的参考文献。每一页的PPT 写的感觉逻辑性很强,内容比较多但是并不给人很乱的感觉。很值得我学习。对于每个问题,都写出目标函数。然后解法,自己的改进。特别的清楚。感觉他的文章比较多。看上去有十来篇paper。牛人。我现在用的主机是此师兄之前的主机。希望我也能有好运气。

LY的我没有听的比较完整。感觉她做了一些工作是对图片里面的东西贴标签的工作。

感觉她的部分工作跟NB 的很像,但是NB 答辩的时候我睡着了。只记得有两次爆笑。最后我自己实在不好意思。就从会议室出来了。

QZ 的工作我也没有完全听完,感觉是做图像的缩络图。一些图像扭曲之类的。还没有答辩的时候是基于深度学习的工作。

对自己工作的启发:看到一个数学公式要赋予它物理意义,每一部分代表什么意思。数学的推导也比较重要。看到数学公式,首先是不要怕,一种心平气和的态度来对待它。对于看不懂的文章。多看几遍。想明白。事情就比较好做了。多做多想问题。才是科研的王道。

老师提问题的时候也会问你有没有ImageNet 的上的结果等。结果是多少,如果你认为在提高的话,可能在那个方面进行提高等等。

训练数据保存为deep_convnet_params.pkl,UI使用wxPython编写。卷积神经网络(CNN)是一种专门针对图像、视频等结构化数据设计的深度学习模型,在计算机视觉、语音识别、自然语言处理等多个领域有广泛应用。其核心设计理念源于对生物视觉系统的模拟,主要特点包括局部感知、权重共享、多层级抽象以及空间不变性。 **1. 局部感知与卷积操作** 卷积层是CNN的基本构建块,使用一组可学习的滤波器对输入图像进行扫描。每个滤波器在图像上滑动,以局部区域内的像素值与滤波器权重进行逐元素乘法后求和,生成输出值。这一过程能够捕获图像中的边缘、纹理等局部特征。 **2. 权重共享** 同一滤波器在整个输入图像上保持相同的权重。这显著减少了模型参数数量,增强了泛化能力,并体现了对图像平移不变性的内在假设。 **3. 池化操作** 池化层通常紧随卷积层之后,用于降低数据维度并引入空间不变性。常见方法有最大池化和平均池化,它们可以减少模型对微小位置变化的敏感度,同时保留重要特征。 **4. 多层级抽象** CNN通常包含多个卷积和池化层堆叠在一起。随着网络深度增加,每一层逐渐提取更复杂、更抽象的特征,从底层识别边缘、角点,到高层识别整个对象或场景,使得CNN能够从原始像素数据中自动学习到丰富的表示。 **5. 激活函数与正则化** CNN中使用非线性激活函数来引入非线性表达能力。为防止过拟合,常采用正则化技术,如L2正则化和Dropout,以增强模型的泛化性能。 **6. 应用场景** CNN在诸多领域展现出强大应用价值,包括图像分类、目标检测、语义分割、人脸识别、图像生成、医学影像分析以及自然语言处理等任务。 **7. 发展与演变** CNN的概念起源于20世纪80年代,其影响力在硬件加速和大规模数据集出现后真正显现。经典模型如LeNet-5用于手写数字识别,而AlexNet、VGG、GoogLeNet、ResNet等现代架构推动了CNN技术的快速发展。如今,CNN已成为深度学习图像处理领域的基石,并持续创新。 资源来源于网络分享,仅用于学习交流使用,请勿用于商业,如有侵权请联系我删除!
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值