机器学习
文章平均质量分 61
飞奔的熊猫
数据挖掘,机器学习
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
scikit-learn Preprocessing学习笔记(三)
Preprocessing是Python scikit learn第六个模块,主要介绍了如何对于数据集的预处理。以下内容包含了一些个人观点和理解,如有疏漏或错误,欢迎补充和指出。这篇主要是自主学习Preprocessing的Python代码,并做相应的记录。原创 2015-03-24 16:08:38 · 2797 阅读 · 0 评论 -
scikit-learn Generalized Linear Models 自主学习笔记(一)
Generalized Linear Models 是scikit-learn的基础知识部分。其中主要讲述了广义线性模型。我个人对统计的理解是Nothing is right,but sometime useful.这句话我也忘记从哪得到的,当时它解释了我许久的困惑,虽然我并不是研究统计学的。我也曾一度认为有人做出某种假设估计是为了行文的方便?历史的经验?或者只是单纯的为了写论文。这些都是我很原创 2015-03-26 14:10:34 · 683 阅读 · 0 评论 -
如何选择机器学习算法(转、译)
Choosing a Machine Learning Classifier 如何选择机器学习算法 jmp0xf 译自Edwin Chen How do you know what machine learning algorithm to choose for your classification problem? Of course, if y转载 2015-03-20 13:57:28 · 446 阅读 · 0 评论 -
假设高维度数据满足高斯分布的合理性
初学机器学习,老是对假设高维度数据的分布近似满足高斯分布或者正态分布表示不解。维基百科中介绍的中心极限定律给予这个现象以合理的解释。以下公式和推理摘自维基百科中的推导。这三个定理分层次递进的介绍了,满足一定条件时,独立,但不同分布的随机变量序列的标准化和以标准正态分布为极限。所以现实生活中,很多数据都无独有偶的表现出了近似高斯分布的性质。因为现实世界里的很多事物都是通过大量独立不同分布的随机变量所原创 2015-03-22 11:03:24 · 3534 阅读 · 0 评论 -
scikit-learn Preprocessing学习笔记(一)
Preprocessing是Python scikit learn第六个模块,主要介绍了如何对于数据集的预处理。以下内容包含了一些个人观点和理解,如有疏漏或错误,欢迎补充和指出。首先,为什么要对数据进行预处理?Should I normalize/standardize/rescale the data文章中介绍了一些笔者的理解和感悟。我从中翻译和摘取了一些要点。我个人认为与怎么去利用函数原创 2015-03-23 13:17:49 · 1239 阅读 · 0 评论 -
scikit-learn Preprocessing学习笔记(二)
Preprocessing是Python scikit learn第六个模块,主要介绍了如何对于数据集的预处理。以下内容包含了一些个人观点和理解,如有疏漏或错误,欢迎补充和指出。Should I standardize the input cases (row vectors)?这句话的意思其实是问要不要对每一个样本做归一化。对样本做归一化常用的有如下方式:原创 2015-03-24 14:07:02 · 1000 阅读 · 0 评论
分享