
大数据与机器学习
诚许愿
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
机器学习之监督学习和 非监督学习区别
两者的不同点1.有监督学习方法必须要有训练集与测试样本。在训练集中找规律,而对测试样本使用这种规律。而非监督学习没有训练集,只有一组数据,在该组数据集内寻找规律。2.有监督学习的方法就是识别事物,识别的结果表现在给待识别数据加上了标签。因此训练样本集必须由带标签的样本组成。而非监督学习方法只有要分析的数据集的本身,预先没有什么标签。如果发现数据集呈现某种聚集性,则可...转载 2019-07-23 16:30:32 · 1595 阅读 · 0 评论 -
机器学习流程
1、从样本特征到样本标签找到计算方法,该计算方法为预测函数,用预测函数可预测结果。2、预测结果与样本标签之间的差距计算函数为损失函数。若损失函数结果较大,则要调整预测函数。当损失可接受之后,为了验证预测函数是否真正有效,另找测试样本集。若结果不佳,则需要重新训练预测函数。机器学习根据预测结果的取值范围,将预测模型分为回归模型和分类模型,其中若预测结果的值是连续的则为回归模型,若预测结果...原创 2019-07-23 16:55:57 · 153 阅读 · 0 评论 -
大数据入门学习篇
大数据包含‘快速化’、‘多样化’、‘价值化’、‘大量化’多重属性。由结构化和非结构化的数组组成,90%为非结构化数据。1、大数据计算模式及其代表产品2、大数据与云计算和物联网的关系云计算处理的主要问题:解决海量数据分布式存储和分布式处理问题、虚拟化、多租户。物联网:各种信息传感器、控制器、机器、人员和物等通过各类可能的网络接入,实现物与物、物与人的泛在连接,形...原创 2019-07-23 10:10:05 · 737 阅读 · 0 评论 -
Spark与机器学习入门篇
视频学习链接:https://study.163.com/course/courseLearn.htm?courseId=1209408816#/learn/video?lessonId=1279281512&courseId=12094088161、Spark MLlib机器学习利用数据或以往经验,一次优化计算机程序的性能标准其中模型是算法用数据进行训练以后得到模型。...原创 2019-07-23 10:50:45 · 602 阅读 · 0 评论