- 博客(7)
- 收藏
- 关注
原创 信息可视化的简单概述
说到信息可视化,很多人肯定还听过数据可视化、知识可视化的概念,这三个之间究竟有什么区别?一般而言需要明确区分这些概念边界是学术界的事情,对于使用可视化的用户来说,则完全没必要纠结在这些细节上。可视化,肯定是因为某个对象不可见或者不怎么容易看到,所以才要将之可视化,让处理对象变得更容易看见或理解,就是可视化的内涵。如果一定要深究其细微差异,请移步《数据可视化、信息可视化、知识可视化三者的区别和联系》...
2018-12-14 16:38:28
5640
原创 ItemCF与UserCF协同过滤算法简单入门和一般过程
这是一篇简单的协同过滤算法简介协同过滤算法,对这个名词稍有了解就知道其应用范围之广,常见的淘宝、京东上的商品推荐,再比如网易云音乐的每日新歌推荐,都采用了基于协同过滤的思想。这个算法神奇之处和缺点本篇文章不过多讨论,这里仅介绍协同过滤的一般实现方法,想必也是应用派最为关注的问题。 主要步骤,为以下几点:获取特征降噪归一化计算相似性筛选邻居构建相似矩阵实现推荐在详细介绍各个步骤之前,
2017-09-24 14:25:40
3431
原创 低版本的Hadoop实现 Apriori 算法Java代码
Apriori 关联规则挖掘的一种算法,其逻辑简单,网上有很多关于算法逻辑的介绍,在此不再赘述。使用hadoop实现Apriori算法的核心在于,循环计算,在Map过程对候选项进行识别,Combine过程和Reduce 过程实现对候选项集的频次统计,并最终输出满足条件的项集合。同样本代码支持低版本的Hadoop运行,欢迎评论交流~
2017-03-27 16:41:45
2632
4
原创 hadoop之Kmeans数据挖掘算法实现
本篇内容主要借鉴hadoop前辈的kmeans代码实现方案,改进距离计算方案等原有代码中的一些小问题,基于低版本的hadoop重新进行编写并实现,欢迎参考,未经允许,不得转载。
2017-03-06 16:14:40
4437
原创 使用Formail发送html格式的中文主题邮件,解决乱码问题等
查了很多资料都没有很好的解决发送中文主题的html格式的邮件,要解决的乱码问题,经过摸索,最后终于搞定,且可使用shell脚本,实现多收件人发送相对比较简单。使用formail发送html格式的邮件,邮件正文内容为html的网页内容,支持更多可变的形式,特别是从数据库取值、图表、链接等。
2017-03-02 18:42:07
4159
原创 python sklearn 机器学习库的安装
python sklearn机器学习库的安装python sklearn 机器学习库的安装开始学习Python并用于实现机器学习算法,看到很多博客都在推荐时间sklearn扩展包实现,导入包的过程就发现很多问题,其中就有sklearn的安装,百度了各种推荐的安装方式都不理想,并没有帮助我实现,这里提供我实现的方式。sklearn的扩展包地址:https://pypi.python.org/pypi/
2017-01-20 15:40:59
1046
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人