
机器学习
carlwu
这个作者很懒,什么都没留下…
展开
-
利用梯度下降法实现简单的线性回归
利用梯度下降算法实现简单的线性回归最近做了好多个数据挖掘的小项目,使用并比较了N多算法,了解了很多机器学习的工具,如R语言、Spark机器学习库、Python、Tensorflow和RapidMiner等等。但是我感觉到自己没能深入下去,充其量也只是把别人的工具拿来玩玩而已。对算法本身的优劣及适用范围不甚了了,更谈不上改进优化算法了。本着甘当小学生的精神,我最近在网上参加了机器学习牛人Andrew原创 2017-07-11 13:07:23 · 8780 阅读 · 4 评论 -
在Tensorflow环境下利用梯度下降法进行线性回归
最近在Coursera学习《Machine Learning 》这门机器学习的入门课。在Matlab中完成作业感觉不是很爽。因此突发奇想,想把第二课的作业在Tensorflow上跑一遍,以加深印象。有关假设模型(Hypothesis)、代价函数(Cost function或Loss function)和梯度下降的概念,请参考前一篇的学习笔记(http://blog.youkuaiyun.com/carlwu/a原创 2017-07-11 23:22:45 · 642 阅读 · 0 评论 -
用R语言的MICE包对缺失数据进行多重插补(一)-- 缺失数据分析
在进行数据分析时,缺失数据是一个令人头痛的问题。数据缺失的原因五花八门,修补这些缺失数据的方法也是因情况而异。插补法(Imputation)是对一种对缺失数据进行调整的方法。该方法用多个可能的值来填充一个缺失的数据项,从而反映了缺失数据的不确定性。本例以R语言的MICE包为例,说明如何使用多重插补方法对缺失值进行估计。原文地址参见https://datascienceplus.com/imputin翻译 2017-07-21 14:20:28 · 41516 阅读 · 6 评论 -
油气行业大数据进展大汇总,不懂你就要失业了
随着大数据对于石油行业的深入,原来的油藏,钻井等技术都将因为该技术而产生革命性的变化,若干年后,也许你的岗位将不复存在。转载 2017-07-25 12:48:34 · 5468 阅读 · 0 评论 -
机器学习中的相似性度量
在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的相似性度量作一个总结。本文目录:1. 欧氏距离2. 曼哈顿距离3. 切比雪夫距离4. 闵可夫斯基距转载 2017-07-28 14:53:06 · 387 阅读 · 0 评论 -
Tensorflow-gpu的错误
今天在Nvidia显卡上安装tensorflow-gpu,安装教程http://blog.youkuaiyun.com/weixin_36368407/article/details/54177380。以前在cpu上跑tensorflow1.3没有问题,就是速度比较慢。在Anaconda3-4.2.0-Windows-x86_64.exe环境下安装了cuda_8.0.61_win10.exe,cudnn-原创 2017-10-19 16:18:32 · 1288 阅读 · 0 评论 -
利用Tensorflow的Slim API实现卷积神经网络
这段时间在小象学院上戎雪健老师主讲《神经网络》这门课。戎老师讲得很好。但我老没时间跑老师给的代码。老师推荐尽量用TF-SLIM实现复杂结构。下面就是以著名的mnist数据集来实例一个神经网络的实现。import osimport numpy as npfrom scipy import ndimageimport matplotlib.pyplot as pltimport t原创 2017-10-24 17:03:45 · 2820 阅读 · 0 评论 -
机器学习和数据科学从业者必读的10本免费英文书
本文编译自https://www.kdnuggets.com/2018/05/10-more-free-must-read-books-for-machine-learning-and-data-science.html。夏天本该是放松的季节,但Matthew Mayo给我们推荐了10本免费的机器学习和数据科学书籍,以打发无聊的长夏。我们先来看下这10本必读免费书的封面:1、Python数据科学手...翻译 2018-06-18 20:46:20 · 4033 阅读 · 0 评论