道路事故分析与跨平台移动界面开发研究
道路事故分析
在道路事故分析中,研究人员收集了事故、道路状况、受伤严重程度、性别、驾照颁发日期、职业、是否醉酒、安全带使用情况、车辆制造年份和保险公司名称等数据。在实验前,对数据进行了预处理。由于多数情况下未提及受伤严重程度,因此忽略了该属性,并移除了所有包含缺失值的特征记录,使记录数量减少到1750条。
为了进行分析,从现有属性中衍生出了新的属性:
1. 时间分类 :将时间划分为两小时的间隔。
2. 年龄分组 :将事故涉及人员的年龄分为老年人(60岁以上)、青年(36岁以下)和中年(其余)。
3. 是否醉酒特征 :若醉酒属性值为酗酒者、吸毒者或醉酒,则“是否醉酒”属性赋值为“是”。
4. 事故日期属性 :根据事故日期衍生出“事故发生日”属性。
5. 道路类型分类 :将道路分为E - 路线、D - 路线、其他道路和交叉路口。
实验使用的特征包括时间间隔、事故类型、事故原因、位置、路线类型、年龄组和是否醉酒。
采用Apriori算法生成关联规则并挖掘数据库中的频繁项集。该算法使用支持度度量来识别频繁项集,支持度计数是包含指定项集的事务数量。它采用逐层搜索技术,基于k - 项集分析(k + 1)项集,并利用反单调性属性。Apriori算法的优点包括能够处理大量交易数据、生成易于理解的规则以及发现数据库中隐藏的知识。
不同类型道路的事故情况如下:
|道路类型|事故占比|常见
超级会员免费看
订阅专栏 解锁全文
1829

被折叠的 条评论
为什么被折叠?



