机器学习项目实践
黄振麟
北海虽赊扶摇可接,东隅已逝桑榆非晚。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
如何实现一个完整的数据挖掘项目@ from《机器学习 Python实践》
转载自:https://blog.youkuaiyun.com/qq_40027052/article/details/78912963?utm_source=blogxgwz31以波士顿房价数据为例,作者详细地展示了做机器学习项目的常规套路,一步一步跟着做受益不小。...转载 2019-01-17 15:33:26 · 1027 阅读 · 0 评论 -
numpy 之 数组与矩阵的运算
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.youkuaiyun.com/u012300744/article/details/80423135 NumPy 支持的几类矩阵乘法也很重要。元素级乘法你已看过了一些元素级乘法。你可以使用 multiply 函数或 * 运算符来实现。回顾一下,它看起来是这样的:m = np.array([[1,2,3],[4,5...转载 2019-03-17 12:00:52 · 292 阅读 · 0 评论 -
numpy 之 数组与矩阵的乘积
转自:https://blog.youkuaiyun.com/bbbeoy/article/details/72576863 1. 当为array的时候,默认d*f就是对应元素的乘积,multiply也是对应元素的乘积,dot(d,f)会转化为矩阵的乘积, dot点乘意味着相加,而multiply只是对应元素相乘,不相加2. 当为mat的时候,默认d...转载 2019-03-17 11:52:58 · 770 阅读 · 0 评论 -
sklearn机器学习之【学习曲线】
【本文精髓源自b站‘莫烦Python’系列教程】【适用于Python3版本,相应第三方库建议升级至最新版本】下面展示两种学习曲线的绘制方法:'''sklearn.learning_curve 中的 learning curve学习曲线 可以很直观的看出我们的 model 学习的进度, 对比发现 有没有overfitting 的问题. 然后我们可以对我们的 model 进行调整, ...原创 2019-03-12 10:11:30 · 2259 阅读 · 0 评论 -
sklearn机器学习之【常见套路代码】
(精髓源自:B站 July-Online 实战视频)使用sklearn随机森林学习器 预测(填补)缺失值:这个很有用,对于手头上没有相关领域知识时挺管用,收藏!from sklearn.ensemble import RandomForestRegressor #随机森林回归; ### 例如 使用 RandomForest 填补缺失的年龄属性def set_missing_ages(d...原创 2019-03-14 21:25:26 · 574 阅读 · 0 评论 -
Pandas 之DataFrame二维表基础
1、DataFrame的创建DataFrame是一种表格型数据结构,它含有一组有序的列,每列可以是不同的值。DataFrame既有行索引,也有列索引,它可以看作是由Series组成的字典,不过这些Series公用一个索引。DataFrame的创建有多种方式,不过最重要的还是根据dict进行创建,以及读取csv或者txt文件来创建。这里主要介绍这两...转载 2019-03-14 19:39:04 · 2894 阅读 · 0 评论 -
Pandas 之DataFrame二维表基础操作及演示
1 简介DataFrame是Python中Pandas库中的一种数据结构,它类似excel,是一种二维表。或许说它可能有点像matlab的矩阵,但是matlab的矩阵只能放数值型值(当然matlab也可以用cell存放多类型数据),DataFrame的单元格可以存放数值、字符串等,这和excel表很像。同时DataFrame可以设置列名columns与行名index,可以通过像matlab一...转载 2019-03-14 19:24:41 · 6097 阅读 · 1 评论 -
numpy 之 .tolist() 的使用规则
1. 将数组或者矩阵转换成列表 如下:>>> from numpy import *>>> a1 = [[1,2,3],[4,5,6]] # a1是列表>>&g转载 2019-03-14 01:13:28 · 990 阅读 · 0 评论 -
sklearn实用小技巧(包括很强大的Pipeline( )管道流函数)
sklearn里面包含内容太多,所以一些实用小技巧还是挺好用的。1、LabelEncoder简单来说 LabelEncoder 是对不连续的数字或者文本进行编号from sklearn.preprocessing import LabelEncoderle = LabelEncoder()le.fit([1,5,67,100])le.transform([1,1,100,67,5])输出: ...转载 2019-03-13 21:54:35 · 1801 阅读 · 0 评论 -
搜集的一些机器学习实战项目
一、用scikit-learn和pandas学习线性回归二、使用sklearn进行集成学习——实践三、如何使用sklearn优雅地进行数据挖掘四、Kaggle平台Titanic生存率预测项目(TOP3%)五、机器学习中,有哪些特征选择的工程方法?六、未完待续.........转载 2019-01-17 16:14:18 · 267 阅读 · 0 评论 -
一个完整的机器学习项目是怎么建立起来的
转载自:https://www.cnblogs.com/rayshaw/p/9037969.html该作者详细展示了机器学习项目一般流程,涉及数据预处理、数据可视化、sklearn模型和参数设定、调参优化比较等。...转载 2019-01-17 15:48:35 · 211 阅读 · 0 评论 -
推荐算法 之 SVD奇异值矩阵分解(有图有真相,非常直观,豁然开朗!)
(这是我目前找到的最直观的SVD推荐算法原理讲解,有图有真相!)转自:https://blog.youkuaiyun.com/u011412768/article/details/52972081 因为要用到基于SVD的推荐作为baseline,所以最近学习了一下SVD这个算法,感觉理解了好长时间。首先看的两篇是介绍S...转载 2019-03-17 20:11:46 · 1568 阅读 · 0 评论
分享