
DataMining学习笔记
文章平均质量分 79
小雨姑娘
每天进步一点点
展开
-
学习朴素贝叶斯算法与交叉验证C实现
C语言程序设计课之朴素贝叶斯算法第一次接触数据挖掘,觉得好有意思啊测试了泰坦尼克号的数据,只取了年龄和性别这两个预测属性。测试准确率78%还是很棒棒的原创 2017-03-30 09:43:21 · 2899 阅读 · 2 评论 -
数据分析在实际项目上的应用
前几天开会拿到了某个项目的一部分数据在会上大家发现了这些数据中出现了很多问题并进行了讨论由于保密的原因数据不能贴出来但是大体的情况是这样的:某个人流量采集系统,当一个人进入系统时,计数+1;当一个人出去时计数-1.随着时间的发展系统会不停有人进进出出,但是当系统重置的时候所有人都应该从系统离开。采集的数据:1.当前时刻进入量2.当前时刻离开量3.原创 2017-04-15 20:05:02 · 3094 阅读 · 0 评论 -
学习数据挖掘决策树ID3算法
一个月前的C语言程序设计课上学习了决策树ID3算法然后自己用了两个多星期的时间开始用C语言实现,结果由于过程太过于复杂,写出来的东西就跟屎一样。可能是自己对于这个算法理解的不够深刻,或者是在设计的时候没有构思好。所以决定在这里写一写大概的构思然后再去用C实现。这样可能会更加有效率一点。决策树之ID3算法:ID3算法的实质是检索哪个属性的分类能力更强,然后用拿原创 2017-04-08 22:50:44 · 4394 阅读 · 0 评论 -
数据挖掘实战经验——交通大数据预测
关于我对最近参加大数据比赛的一些经历和经验。原创 2017-08-13 01:18:14 · 14479 阅读 · 8 评论 -
数据挖掘实战——交通大数据预测II
经过了近两个月的艰苦工作,这次在阿里天池的比赛终于结束了。第一次正经的去参加数据挖掘的比赛,从第一赛季开始到第二赛季结束,完整地经历了整个流程,每天提出新想法,学习新的方法,然后用编程的方法去实现,看着自己的MAPE一天天的下降,那种感觉也是很棒的。觉得付出了很多,也收获了很多,自己也找到了自己的方向,希望自己在未来可以朝着大数据和人工智能方向继续前行。而且这次比赛之后,自己在剩下三年的大学时光中原创 2017-09-19 15:31:06 · 10838 阅读 · 4 评论