
python
DataAnalysts
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
利用Python进行数据分析:数据规整化——清理、转换、合并、重塑
原创 2019-02-01 16:16:35 · 392 阅读 · 0 评论 -
利用Python进行数据分析:Pandas入门
原创 2019-01-30 17:12:24 · 289 阅读 · 0 评论 -
机器学习笔记 贝叶斯分类器(附Python与R代码)
朴素贝叶斯算法 原理:通过某对象的先验概率,利用贝叶斯公式计算出后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。 主要特点: 属性可以离散,也可以连续; 数学基础扎实,分类效率稳定; 对缺失和噪声数据不太敏感; 属性如果不相关,分类效果很好;如果相关,则不低于决策树。 学习模型:计算对象归属于某一类的后验概率,以此最大概率的类作为对象所属类。即待学习的是对象的后...原创 2019-02-12 14:05:57 · 2978 阅读 · 0 评论 -
机器学习笔记 K近邻(附Python与R代码)
K近邻算法 原理:通过计算新数据和训练数据特征值之间的距离,然后选取K个距离最近的邻居进行分类判断(投票法)或者回归。 特点:不具有显示的学习过程,直接预测。实际上式利用训练数据集对特征向量空间进行划分,并且作为其分类的“模型”。 k值选择: k=1,称为最近邻算法。此时将训练集中与测试样本最近的点类别作为测试样本的分类。 k较小,用较小的邻域中的训练实例进行预测。偏差较小,方差较大,对近邻的实...原创 2019-02-12 16:54:18 · 546 阅读 · 0 评论 -
机器学习笔记 PCA降维PYTHON代码
PCA 原型:class sklearn.decomposition.PCA(n_components=None,copy=True,whiten=False) 参数: 属性: 方法: 注:该方法基于SVD分解,无法解决稀疏项,并无法处理超大规模数据,因为其要求所有数据一次加入内存。 代码实例: 加载包 ...原创 2019-02-13 11:09:31 · 1886 阅读 · 0 评论