
机器学习
有梦想的人不睡觉121
大数据开发
展开
-
机器学习入门知识
什么事机器学习?我们会发现这里涉及很多基于经验做出的预判.例如,为 什么看到微温路面、感到和风、看到晚霞,就认为明天是好天呢?这是因为在 我们的生活经验中已经遇见过很多类似情况,头一天观察到上述特征后,第二 天天气通常会很好。为什么色泽青绿、根蒂蜷缩、敲声浊晌,就能判断出是正 熟的好瓜?因为我们吃过、看过很多西瓜,所以基于色泽、根蒂、敲声这几个 特征我们就可以做出相当好的判断.类似的,我们从以往的...原创 2018-06-29 17:35:53 · 6857 阅读 · 1 评论 -
从将机器学习模型转化成真正产品和服务中学到的经验教训
人工智能依然处于它的幼年时期。今天,只有15%的企业在使用机器学习,但是有30%的企业已经在它们未来的发展路线图里包括了机器学习。像Intel的CEO这样的公众人物宣称,每一个企业都应该有一个机器学习的战略,否则就会有落后的风险。那么机器学习进入你的组织机构就仅仅只是个时间问题。当然,它目前还没有进入。然而在与希望在其企业中实施机器学习的CEO交谈时我们发现:将机器学习从科学转向生产似乎存在一...转载 2018-09-02 10:09:16 · 5968 阅读 · 1 评论 -
黄渤《一出好戏》首日票房 1.5 亿,口碑碾压《爱情公寓》凭的是什么?
本人作为黄渤的粉丝,《一出好戏》当然是必看无疑呀。在今天正式观看之前,先来通过猫眼的影评来分析下网友对它的反馈。 爬取数据 这里通过去请求猫眼的 API 来抓取数据,借助的工具是 requests 。这里简单说下猫眼影评的 API:http://m.maoyan.com/mmdb/comments/movie/1203084.json?_v_=yes&am...转载 2018-08-13 09:27:55 · 6825 阅读 · 0 评论 -
如何使用 Java 调取 Python、R 的训练模型?
在工业界,我们经常会使用 Python 或 R 来训练离线模型, 使用 Java 来做在线 Web 开发应用——这就涉及到了使用 Java 跨语言来调用 Python 或 R 训练的模型。 PMML PMML 是 Predictive Model Markup Language 的缩写,翻译为中文就是“预测模型标记语言”。它是一种基于XML的标准语言,用于表达数据挖掘模型,可以用来...转载 2018-08-13 09:07:59 · 10003 阅读 · 10 评论 -
模型的评估和选择之性能度量
对学习器的泛化性能进行评估,不仅需要有效可行的实验估计方法,还需 要有衡量模型泛化能力的评价标准,这就是性能度量(performance measure)。性能度量反映了任务需求,在对比不同模型的能力时,使用不同的性能度量往 往会导致不同的评判结果;这意味着模型的"好坏"是相对的,什么样的模型 是好的?不仅取决于算法和数据,还决定于任务需求。在预测任务中,给定样例集 D = {(X1,Y1) , ...原创 2018-07-06 15:10:01 · 8897 阅读 · 0 评论 -
ID3决策树程序实现
原文地址:https://blog.youkuaiyun.com/hongbin_xu/article/details/78516114前言之前的博客中介绍了决策树算法的原理并进行了数学推导(机器学习入门学习笔记:(3.1)决策树算法)。决策树的原理相对简单,决策树算法有:ID3,C4.5,CART等算法。接下来将对ID3决策树算法进行程序实现,参考了《机器学习实战》一书。这篇博客也作为自己个人的学习笔记,以...转载 2018-07-03 10:39:19 · 13536 阅读 · 4 评论 -
SVM算法
原文地址:https://blog.youkuaiyun.com/hongbin_xu/article/details/78508275前言支持向量机(Support Vector Machine,简称SVM)可以说是最经典的机器学习算法之一了。这几天再看SVM,参考了一些书籍和博客,这里把自己的笔记记录下来,以便以后复习查看。间隔(margin)分类学习最基本的思想就是:寻找一个超平面把数据集的样本空间划分...转载 2018-07-03 10:36:58 · 20332 阅读 · 0 评论 -
线性回归理论推导
原文地址:https://blog.youkuaiyun.com/hongbin_xu/article/details/77102810理论推导 机器学习所针对的问题有两种:一种是回归,一种是分类。回归是解决连续数据的预测问题,而分类是解决离散数据的预测问题。线性回归是一个典型的回归问题。其实我们在中学时期就接触过,叫最小二乘法。 线性回归试图学得一个线性模型以尽可能准确地预测输出结果。 先从简单的模...转载 2018-07-03 09:39:17 · 6169 阅读 · 0 评论 -
机器学习模型的评估和选择
模型评估与选择经验误差与过拟合通常我们把分类错误的样本数占样本总数的比例称为"错误率" (error rate) ,即如果在 m 个样本中有 α 个样本分类错误,则错误率 E= α/m; 相应的, 1 - α/m 称为"精度" (accuracy) ,即"精度 =1 -错误率"更一般地,我们把学习 器的实际预测输出与样本的真实输出之间的差异称为"误差" (error), 学习器在训练集上的误差称为...原创 2018-07-02 10:28:47 · 6432 阅读 · 0 评论 -
各领域公开数据集下载
原文地址:https://zhuanlan.zhihu.com/p/25138563金融美国劳工部统计局官方发布数据房地产公司 Zillow 公开美国房地产历史数据沪深股票除权除息、配股增发全量数据,截止 2016.12.31上证主板日线数据,截止 2017.05.05,原始价、前复权价、后复权价,1260支股票深证主板日线数据,截止 2017.05.05,原始价、前复权价、后复权价,466支股票...转载 2018-07-01 22:16:07 · 6454 阅读 · 0 评论 -
美图个性化推荐的实践与探索
互 联网技术将我们带入了信息爆炸的时代,面对海量的信息,一方面用户难以迅速发现自己感兴趣的信息,另一方面长尾信息得不到曝光。为了解决这些问题,个性化推荐系统应运而生。美图拥有海量用户的同时积累了海量图片与视频,通过推荐系统有效建立了用户与内容的连接,大幅度提升产品的用户体验。在第七期美图技术沙龙中美图技术专家 蔡淇森分享了美图技术团队在个性化推荐上的实践与探索,希望对打开本篇文章的你有所启发...转载 2018-09-13 09:46:03 · 5279 阅读 · 0 评论