Deep Learning Papers

本文概述了深度学习在图像分类、检测与分割、搜索、文本生成与语音处理等计算机视觉领域的最新进展与应用实例。
部署运行你感兴趣的模型镜像

原地址:http://blog.youkuaiyun.com/sunbaigui/article/details/46364091

第一次转载,不知道是不正确

一、Image Classification(Recognition)

lenet: http://yann.lecun.com/exdb/publis/pdf/lecun-01a.pdf

alexnet: http://www.cs.toronto.edu/~fritz/absps/imagenet.pdf

overfeat: http://arxiv.org/pdf/1312.6229v4.pdf

vgg: http://arxiv.org/pdf/1409.1556.pdf

googlenet: http://arxiv.org/pdf/1409.4842v1.pdf


二、Image Detection(Segmentation)

overfeat: http://arxiv.org/pdf/1312.6229v4.pdf

dnn: http://papers.nips.cc/paper/5207-deep-neural-networks-for-object-detection.pdf

rcnn: http://arxiv.org/pdf/1311.2524.pdf

spp: http://arxiv.org/pdf/1406.4729v4.pdf

fcn: http://arxiv.org/pdf/1411.4038v2.pdf

fast rcnn:  http://arxiv.org/pdf/1504.08083v1.pdf


三、Image(Visual)  Search

feature learning+hash: http://arxiv.org/pdf/1504.03410v1.pdf

triplet learning: http://arxiv.org/pdf/1412.6622v3.pdf

deep rank: http://arxiv.org/pdf/1404.4661v1.pdf

Visual Search at Pinterest: http://arxiv.org/pdf/1505.07647v1.pdf


四、Image/Video Captioning

Baidu/UCLA: http://arxiv.org/abs/1410.1090
Toronto: http://arxiv.org/abs/1411.2539
Berkeley: http://arxiv.org/abs/1411.4389
Google: http://arxiv.org/abs/1411.4555
Stanford: http://cs.stanford.edu/people/karpathy/deepimagesent/
UML/UT:  http://arxiv.org/abs/1412.4729
Microsoft/CMU:  http://arxiv.org/abs/1411.5654
Microsoft:  http://arxiv.org/abs/1411.4952


您可能感兴趣的与本文相关的镜像

Qwen3-8B

Qwen3-8B

文本生成
Qwen3

Qwen3 是 Qwen 系列中的最新一代大型语言模型,提供了一整套密集型和专家混合(MoE)模型。基于广泛的训练,Qwen3 在推理、指令执行、代理能力和多语言支持方面取得了突破性进展

内容概要:本文介绍了一套针对智能穿戴设备的跑步/骑行轨迹记录系统实战方案,旨在解决传统运动APP存在的定位漂移、数据断层和路径分析单一等问题。系统基于北斗+GPS双模定位、惯性测量单元(IMU)和海拔传感器,实现高精度轨迹采集,并通过卡尔曼滤波算法修正定位误差,在信号弱环境下利用惯性导航补位,确保轨迹连续性。系统支持跑步与骑行两种场景的差异化功能,包括实时轨迹记录、多维度路径分析(如配速、坡度、能耗)、数据可视化(地图标注、曲线图、3D回放)、异常提醒及智能优化建议,并可通过蓝牙/Wi-Fi同步数据至手机APP,支持社交分享与专业软件导出。技术架构涵盖硬件层、设备端与手机端软件层以及云端数据存储,强调低功耗设计与用户体验优化。经过实测验证,系统在定位精度、续航能力和场景识别准确率方面均达到预期指标,具备良好的实用性和扩展性。; 适合人群:具备一定嵌入式开发或移动应用开发经验,熟悉物联网、传感器融合与数据可视化的技术人员,尤其是从事智能穿戴设备、运动健康类产品研发的工程师和产品经理;也适合高校相关专业学生作为项目实践参考。; 使用场景及目标:① 开发高精度运动轨迹记录功能,解决GPS漂移与断点问题;② 实现跑步与骑行场景下的差异化数据分析与个性化反馈;③ 构建完整的“终端采集-手机展示-云端存储”系统闭环,支持社交互动与商业拓展;④ 掌握低功耗优化、多源数据融合、动态功耗调节等关键技术在穿戴设备中的落地应用。; 阅读建议:此资源以真实项目为导向,不仅提供详细的技术实现路径,还包含硬件选型、测试验证与商业扩展思路,建议读者结合自身开发环境,逐步实现各模块功能,重点关注定位优化算法、功耗控制策略与跨平台数据同步机制的设计与调优。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值