
机器学习
心雨先生
做一条有理想的咸鱼
展开
-
8.7 Mahout与协同过滤
mahout是一个工具一个来自Apache的、开源的、JAVA的机器学习软件库当所处理的数据规模远大于单机处理能力时成为一种可选的机 器学习工具,建立在Apache的Hadoop分布式计算项目之上mahout安装:1,上传apache-mahout-distribution-0.12.2.tar.gz包到linux服务器(hdfs集群的一个节点安装就行)2,解压tar -zxvf apache-m...原创 2018-07-12 08:26:06 · 289 阅读 · 0 评论 -
8.6 R语言-关联规则
理解关联规则:市场购物篮分析的结果是一组指定商品之间关系模式的关联规则。一个典型的规则可以表述为: {花生酱,果冻} –> {面包}这个关联规则用通俗易懂的语言来表达就是:如果购买了花生 酱和果冻,那么也很有可能会购买面包。一个项集或者规则度量法的支持度是指其在数据中出现的频率置信度是指该规则的预测能力或者准确度的度量鲜花的支持度support X=4/5慰问卡的支持度 Y=3/5鲜花X--...原创 2018-07-11 09:01:20 · 938 阅读 · 0 评论 -
8.5 Python机器学习--微博聚类和音乐分类理论记录
Python机器学习:隆重推出scikit-learn机器学习库Scikit-Learn是基于python的机器学习模块Scikit-Learn中的机器学习模型非常丰富,包括SVM,决策树, GBDT,KNN等等,可以根据问题的类型选择合适的模型Scikit-Learn的安装需要numpy,scipy,matplotlib等模块微博聚类:数据集(微博数据)算法使用(scikit-learn中的km...原创 2018-07-10 08:53:24 · 1796 阅读 · 1 评论 -
8.3 机器学习—Python语言
Python是解释型语言,是高级编程语言可面向对象可升级Python环境安装:python-2.7.9.amd64.msi相当于jdk直接windows安装,注意安装目录不要有中文和空格安装的时候要是没有选择自动配置环境变量,需要手动配置,在path后面加上C:\Python27PyDev.zip是为了方便eclipse操作python,解压放到eclipse对应包eclipse配置python环...原创 2018-07-06 08:50:36 · 386 阅读 · 0 评论 -
8.2 机器学习—神经网络
神经网络:激活函数:将神经元的净输入信号转换成单一的输出信号,以便进一 步在网络中传播。 网络拓扑:描述了模型中神经元的数量以及层数和它们连接的方式。 训练算法:指定如何设置连接权重,以便抑制或增加神经元在输入信 号中的比重。concrete.R:判断强度是否合格concrete <- read.csv("concrete.csv")str(concrete)#缩放/归一化,定义函数norm...原创 2018-07-05 09:18:40 · 509 阅读 · 0 评论 -
8.1 机器学习—R语言-线性回归
机器学习就是拟人数据+算法-->找规律大数据公司主要分四类:1,数据拥有者,数据源,PB级数据的包子铺2,大数据咨询公司,Cloudera--CDH3,大数据工具公司,Databricks--Apache Shark4,整合应用型,结合机器学习来解决更多实际的痛点机器学习是什么已有的数据(经验)某种模型(迟到的规律)利用此模型预测未来(是否迟到)机器学习界“数据为王”思想R语言:主要用于统计...原创 2018-07-04 13:36:23 · 1190 阅读 · 1 评论