【论文笔记】Efficient and Realtime Distracted Driver Detection With MobileVGG Network

最新推荐文章于 2025-01-26 09:49:10 发布

原创

最新推荐文章于 2025-01-26 09:49:10 发布 · 324 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #神经网络

Towards Computationally Efficient and Realtime Distracted Driver Detection With MobileVGG Network

第一遍：读标题、摘要和图表

标题： 基于移动VGG网络的实时高效的司机分心驾驶检测

摘要： 本文提出了基于深层可分离卷积的移动VGG网络结构，用在两个数据集上效果都很好，而且大小只有2.2M。实现了实时高效。

图表：
图一：标准卷积和其等价深层可分离卷积，好像就是把一个大块按长度和按面积分成了一小块一小块
图二/表一：移动VGG网络结构
图三：数据集中司机行为的分类
图四：训练和测试的loss和accuracy
表二四：CONFUSION MATRIX OF PROPOSED MOBILEVGG ARCHITECTURE
ON AUC DATASET基于澳柯币数据的移动互联网架构的混淆？？？这个表没看懂
表三五：两个数据集上的accuracy
图五：标错的label及其正确label
表六七八：和其他的网络比较时间和accuracy

第二遍：读引言和结论部分，再浏览一遍图片，并快速浏览论文的其他部分。

讲讲他的危害多么严重，然后说明自己做的东西多么重要，介绍下其他人的研究，再说说他们哪里不足，准确率不够或者效率不够，然后提出自己的新的CNN模型，在效率提高的同时又保证准确率。

第三遍：阅读论文的全部内容，适当跳过复杂的公式

具体怎么做的呢，基于深层可分离卷积的移动VGG网络结构，当然要介绍深度可分离卷积和VG

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

zoroooooo

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

驾驶员行为检测（饮酒、使用手机）——基于StateFarm分心驾驶数据集与YOLOv10的深度学习实践

YOLO

05-28

573

类别编号行为描述0安全驾驶1使用手机（右手）2使用手机（左手）3打电话（右手）4打电话（左手）5调节收音机6喝饮料7转头看后视镜8挽头发9打哈欠本项目主要关注**喝饮料(drinking)和使用手机(phone use)**两个类别。YOLOv10是YOLO系列最新版本，保持了高精度和高速推理的优势，适合嵌入式和边缘设备。本文完整介绍了基于StateFarm分心驾驶数据集的驾驶员行为检测项目，详细讲解了数据预处理、YOLOv10模型训练、推理实现及UI界面集成。

【系统设计与实现】基于flink的分心驾驶预测与数据分析系统

xzq1207105685的博客

07-28

1245

通过flink和随机森林模型实时识别驾驶员用户是否处于警惕状态，并进行进一步数据统计和分析，将分析结果保存在hbase，并通过Websocket向用户提供实时的分析结果。

1 条评论您还未登录，请先登录后发表或查看评论

1 条评论

胖墩墩2024 2023.12.27
数据集在哪获取

CNN常用模型 1 VGG16、2 Mobile_V1、3 Mobile_V2、 4 Mobile_V3

qq_35732321的博客

03-01

461

CNN 常用模型1 VGG162 Mobile_V13 Mobile_V24 Mobile_V3ResNet506 Xception7 Inception RestNetV28 Inception V3 1 VGG16 2 Mobile_V1 3 Mobile_V2 4 Mobile_V3 ResNet50 6 Xception 7 Inception RestNetV2 8 Inception V3

【文献阅读】2018-2022年驾驶员分心行为识别或检测

qq_40946271的博客

11-14

3364

整理了近五年部分驾驶员分心行为识别的论文，主要是基于图像进行分类的算法，一般在AUC或者state farm数据集上测试，也有自己采集数据的。

Distracted-Driver-Classification:分散注意力的驾驶员多动作分类

03-11

分散注意力的驾驶员多动作分类 :automobile: :sport_utility_vehicle: :bus: 1.问题预测可能性：驾驶员在每个演讲中都在做什么？我们需要图像分类成以下10类 c0：安全驾驶 c1：发短信（右） c2：电话交谈（右） c3：发短信（左） c4：电话交谈（左） c5：操作收音机 c6：喝酒 c7：伸手去拿 c8：化妆 c9：与Pessenger交谈 2.资料 3.特点数据由驾驶员图像组成，每个图像都是在汽车中拍摄的，驾驶员在汽车中做某事发短信吃在讲电话化妆品伸手向后（伸到后座上的某些物体） 4.档案 imgs.zip-所有（训练/测试）图像的压缩文件夹。 sample_submission.csv-格式正确的样本提交文件。 driver_imgs_list.csv-培训图像，其主题（驾驶员）ID和班级ID的列表。 5.图书馆 NumPy 大熊猫 Matplotlib 斯克莱恩凯拉斯（实用程

深度学习-分心驾驶员检测数据集

03-16

深度学习--分心驾驶员检测数据集

论文笔记 DXSLAM: A Robust and Efficient Visual SLAM System with Deep Features

weixin_43199832的博客

03-22

885

论文链接：https://arxiv.org/pdf/2008.05416.pdf 代码链接：https://github.com/ivipsourcecode/dxslam 主要内容本文的主要工作为使用CNN（Convolutional Neural Network，卷积神经网络）提取特征，然后将所提取的特征整合到现代的SLAM(ORB SLAM2)框架中。其中，作者选择了性能优异的HF-Net，提取每帧图像的局部特征以及整幅图像的全局特征，使得所整合的SLAM系统，相比使用手工特征点的SLAM系统，在

【论文阅读】Realtime Robust Malicious Traffic Detection via Frequency DomainAnalysis

m0_46629911的博客

09-21

1649

恶意流量检测

《Simple Online and Realtime Tracking》SORT论文笔记

qq_41614538的博客

12-03

1276

《Simple Online and Realtime Tracking》 2016 IEEE ICIP source code 摘要：这篇论文探索了一种务实方法来解决MOT问题，主要关注点在高效地frame-to-frame associate objects，使其能支持online、realtime的应用。为达到这个目的，检测质量成为影响tracking效果的关键因素（改变detector可...

【论文阅读】Realtime Robust Malicious Traffic Detection via Frequency Domain Analysis

airen的博客

04-29

2877

原文标题：Realtime Robust Malicious Traffic Detection via Frequency DomainAnalysis 原文作者：Chuanpu Fu, Qi Li, Meng Shen, and Ke Xu 发表会议：2021 ACM Computer and Communications Security Conference（CCS）原文连接：https://www.software-lab.org/publications/ccs2021_pre-final..

【数据集】驾驶员分心检测数据集（State Farm Distracted Driver Detection）

weixin_46440934的博客

09-30

8865

【数据集】驾驶员分心检测数据集（State Farm Distracted Driver Detection）。图片共分为10个类别。c0：安全驾驶c1：用右手发短信c2：用右手打电话c3：用左手发短信c4：用左手打电话c5：操作收音机c6：喝东西c7：伸手到后面c8：整理发型和妆容c9：与乘客交谈。

YOLO算法DMS驾驶员分心驾驶检测数据集+7000数据集

08-20

7000多张YOLO驾驶员分心驾驶检测数据集，数据集目录已经配置好，划分好 train，val, test，并附有data.yaml文件，yolov5、yolov7、yolov8，yolov9等算法可以直接进行训练模型，txt格式标签，数据集和检测结果参考：https://blog.youkuaiyun.com/zhiqingAI/article/details/124230743 数据集配置目录结构data.yaml： train: ../train/images val: ../valid/images test: ../test/images nc: 3 names: ['drinking', 'looking_away', 'safe_driving']

基于深度学习实现驾驶员分心驾驶行为识别项目源码+数据集+模型+项目说明.7z

12-12

基于深度学习实现驾驶员分心驾驶行为识别项目源码+数据集+模型+项目说明.7z 附数据集下载链接，输入一张图片，输出驾驶员状态及概率驾驶员状态识别如下 c0: 安全驾驶 c1: 右手打字 c2: 右手打电话 c3: 左手打字 c4: 左手打电话 c5: 调收音机 c6: 喝饮料 c7: 拿后面的东西 c8: 整理头发和化妆 c9: 和其他乘客说话【使用工具】 OpenCV Matlibplot Pytorch TensorboardX 【代码介绍】 data_mean.py 统计训练图片的均值与标准差 splite_valid.py 分离验证集与训练集 visual_classes.py 浏览每个驾驶状态 visual_samples.py 浏览随机的样本 model_plot.py 利用_tensorboardX_进行模型的绘制【特别强调】 1、csdn上资源保证是完整最新，会不定期更新优化； 2、请用自己的账号在csdn官网下载，若通过第三方代下，博主不对您下载的资源作任何保证，且不提供任何形式的技术支持和答疑！！！

driver_distraction_task:使用kaggle的数据集使驾驶员分心的任务

04-01

使用内置摄像头分散驾驶员注意力在此任务中，我使用了一个深层神经网络（ResNet50模型）（内置）如果司机从道路分心走来检测。用于训练网络的数据集来自，它由代表驾驶员行为的十个类别的图像组成。管道架构：数据加载和可视化。火车验证拆分。加载并微调ResNet50。模型训练。测试我们的最终模型。我将在下面详细解释每个步骤。步骤1：数据加载和可视化。如前所述，在此任务中，我使用Kaggle状态农场分散驾驶员检测，它包括10个类别，代表驾驶员在监控道路时的行为，这些类别是（安全驾驶，发短信-正确，电话交谈-正确，发短信-左侧，电话交谈-左，操作收音机，喝酒，伸手去后，头发和化妆，与乘客交谈），共收录近22424张图像，每个班级均收录近2000张图像，分布如下：第2步：火车验证拆分。将十个类别的所有图像加载到一个列表中后，我将它们进行混洗并按照0.8：0

基于深度学习实现驾驶员分心驾驶行为识别项目源码+数据集+模型+毕设论文

09-13

基于深度学习实现驾驶员分心驾驶行为识别项目源码+数据集+模型+毕设论文，含有代码注释，新手也可看懂。毕业设计、期末大作业、课程设计、高分必看，下载下来，简单部署，就可以使用。该项目可以作为毕设、课程设计期末大作业使用，该系统功能完善、界面美观、操作简单、功能齐全、管理便捷，具有很高的实际应用价值。基于深度学习实现驾驶员分心驾驶行为识别项目源码+数据集+模型+毕设论文，含有代码注释，新手也可看懂。毕业设计、期末大作业、课程设计、高分必看，下载下来，简单部署，就可以使用。该项目可以作为毕设、课程设计期末大作业使用，该系统功能完善、界面美观、操作简单、功能齐全、管理便捷，具有很高的实际应用价值。基于深度学习实现驾驶员分心驾驶行为识别项目源码+数据集+模型+毕设论文，含有代码注释，新手也可看懂。毕业设计、期末大作业、课程设计、高分必看，下载下来，简单部署，就可以使用。该项目可以作为毕设、课程设计期末大作业使用，该系统功能完善、界面美观、操作简单、功能齐全、管理便捷，具有很高的实际应用价值。基于深度学习实现驾驶员分心驾驶行为识别项目源码+数据集+模型+毕设论文，含有代码注释，新手也可

草莓成熟度检测数据集VOC+YOLO格式3294张4类别

FL1623863129的博客

01-26

492

标注类别名称(注意yolo格式类别顺序不和这个对应，而以labels文件夹classes.txt为准):["flower","half_ripe","initial_ripe","ripe"]数据集格式：Pascal VOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)特别声明：本数据集不对训练的模型或者权重文件精度作任何保证，数据集只提供准确且合理标注。标注数量(xml文件个数)：3294。标注数量(txt文件个数)：3294。

[数据集][目标检测]道路坑洞目标检测数据集VOC+YOLO格式665张1类别

FL1623863129的博客

12-13

870

数据集格式：Pascal VOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)特别声明：本数据集不对训练的模型或者权重文件精度作任何保证，数据集只提供准确且合理标注。标注类别名称:["pothole"]图片数量(jpg文件个数)：665。标注数量(xml文件个数)：665。标注数量(txt文件个数)：665。pothole 框数 = 1740。使用标注工具：labelImg。标注规则：对类别进行画矩形框。

【多模态AI】关于数据 OSF 多模态分心数据集介绍

黑符石笔记集

03-28

468

该数据集包含多个68个被试，88套数据在四种不同条件下驾驶同一条高速公路的数据。

RT-DETR (Realtime Detection Transformer)