
M_M|机器学习【python】
liming850628
性格开朗,兴趣广泛,
展开
-
机器学习(1)机器学习的范围
机器学习的范围包括但是不局限与如下:机器学习跟模式识别,统计学习,数据挖掘,计算机视觉,语音识别,自然语言处理等领域有着很深的联系。从范围上来说,机器学习跟模式识别,统计学习,数据挖掘是类似的,同时,机器学习与其他领域的处理技术的结合,形成了计算机视觉、语音识别、自然语言处理等交叉学科。因此,一般说数据挖掘时,可以等同于说机器学习。同时,我们平常所说的机器学习应用,应该是通用的,不仅仅局限在结构化数据,还有图像,音频等应用。翻译 2016-08-20 17:05:03 · 1639 阅读 · 0 评论 -
机器学习(2)数学知识积累
说起数学,我觉得大学学了一大堆记住的没有几个,今天从新把机器学习需要掌握的数学温习一下,先给出目录,后期会单独整理每一种数据知识。下面我给大家整理一下那些年我们一起学过的数学1、向量2、几何以及三角函数3、排列组合4、高等代数5、线性代数6、离散数学7、概率论原创 2016-08-20 17:15:20 · 513 阅读 · 0 评论 -
机器学习(3)机器学习算法目录
下面罗列一下资源目录的目录结构数据预处理(preprocessing)缺失值处理异常值处理分类(classifier)KNN朴素贝叶斯聚类(clustering)KmeansDBScan回归(regression)线性回归逻辑回归文本挖掘(textmining)分词停用词特征提取(association)特征提取降维时原创 2017-12-05 13:36:30 · 385 阅读 · 0 评论 -
机器学习(0)-学习目录
最近在学习“机器学习"觉得机器学习神奇,以下弄一些学习的方法和目录。为自己方便也为后来人少走弯路。机器学习的概念入门机器学习入门机器学习的范围数学知识积累经典算法介绍应用场景原创 2016-08-20 16:58:02 · 636 阅读 · 0 评论 -
机器学习(5)概念积累
资源目录1、Bagging和Boosting 概念及区别原创 2017-12-05 11:12:02 · 368 阅读 · 0 评论 -
机器学习(5)Bagging和Boosting 概念及区别
Bagging和Boosting都是将已有的分类或回归算法通过一定方式组合起来,形成一个性能更加强大的分类器,更准确的说这是一种分类算法的组装方法。即将弱分类器组装成强分类器的方法。首先介绍Bootstraping,即自助法:它是一种有放回的抽样方法(可能抽到重复的样本)。1、Bagging (bootstrap aggregating)Bagging即套袋法,其算法过程如转载 2017-12-05 11:13:06 · 332 阅读 · 0 评论 -
python7中测试性能的工具
当运行一个复杂的 Python 程序,它需要很长时间来执行。你或许想提升它的执行时间。但如何做?首先,你需要工具来查明你代码的瓶颈,比如,那部分执行花费的时间长。用这个方法,你可以首先专注于提升这部分的速度。而且,你也应该控制内存和 CPU 使用率,因为它可以为你指出的代码可以改进的新的部分。所以,在本文中,我将对 7 个不同的 Python 工具发表意见,给你一些关于转载 2017-11-10 15:31:29 · 645 阅读 · 0 评论 -
python 科学计算环境安装(xgboost)
Numpy , Scipy , matplotlib 和 networkx 等,以及 beautiful-soup , requests , flask , tornado,scikit-Learn,xgboost安装搜索相关包:anaconda search -t conda xgboost安装(xgboost):conda install -c mndrake xg原创 2017-07-18 14:15:01 · 476 阅读 · 0 评论 -
机器学习(2.7.2)数据知识积累——概率论-超几何分布
超几何分布是统计学上一种离散概率分布。它描述了由有限个物件中抽出n个物件,成功抽出指定种类的物件的次数(不归还)。称为超几何分布,是因为其形式与“超几何函数”的级数展式的系数有关。在产品质量的不放回抽检中,若N件产品中有M件次品,抽检n件时所得次品数X=k,则P(X=k)=C(M,k)·C(N-M,n-k)/C(N,n), C(a b)为古典概型的组合形式,a为下限,b为上限,此时我们称随机变转载 2016-09-14 11:03:34 · 3185 阅读 · 0 评论 -
机器学习(2.100)数据知识积累——香农熵
1948 年,香农提出了“信息熵”(shāng) 的概念,才解决了对信息的量化度量问题。一条信息的信息量大小和它的不确定性有直接的关系。比如说,我们要搞清楚一件非常非常不确定的事,或是我们一无所知的事情,就需要了解大量的信息。相反,如果我们对某件事已经有了较多的了解,我们不需要太多的信息就能把它搞清楚。所以,从这个角度,我们可以认为,信息量的度量就等于不确定性的多少。先给出公式:假翻译 2016-08-23 19:49:01 · 1293 阅读 · 0 评论 -
机器学习(2.1)数据知识积累——向量
向量在数学中,几何向量(也称为欧几里得向量,通常简称向量、矢量),指具有大小(magnitude)和方向的量。向量可以形象化地表示为带箭头的线段。箭头所指:代表向量的方向;线段长度:代表向量的大小。向量的记法:印刷体记作粗体的字母(如a、b、u、v),书写时在字母顶上加一小箭头→。[1] 如果给定向量的起点(A)和终点(B),可将向量记作AB(并于顶上加→)。给空间设一直角坐标原创 2016-08-23 11:35:24 · 1444 阅读 · 0 评论 -
人工智能(2.2)数学基础积累——三角函数
三角函数是以角度(数学上最常用弧度制,下同)为自变量,角度对应任意角终边与单位圆交点坐标或其比值为因变量的函数。也可以等价地用与单位圆有关的各种线段的长度来定义。三角函数在研究三角形和圆等几何形状的性质时有重要作用,也是研究周期性现象的基础数学工具。在数学分析中,三角函数也被定义为无穷级数或特定微分方程的解,允许它们的取值扩展到任意实数值,甚至是复数值。三角函数十组诱导公式翻译 2016-08-23 14:19:01 · 977 阅读 · 0 评论 -
机器学习(3)经典算法介绍
机器学习算法的分类1.分类2.聚合3.回归4.关联5.改进6.特征值识别机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。本文为您总结一下常见的机器学习算法,以供您在工作和学习中参考。机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面翻译 2016-08-20 17:27:09 · 1793 阅读 · 0 评论 -
机器学习(2.4)数据知识积累——高等数学
一、函数与极限1.函数基本概念1. 集合及集合的运算2. 数轴、无穷大和无穷小的几何表示、区间3. 常量和变量4. 函数的定义和函数的表达方式5. 函数的定义域和函数的计算6. 基本初等函数7. 复合函数和初等函数8. 分段函数2.函数的极限及运算法则1. 数列及数列极限2. 函数的极限3. 无穷大和无转载 2016-09-12 16:14:40 · 1364 阅读 · 0 评论 -
机器学习(2.3)数据知识积累——排列组合
排列组合公式/排列组合计算公式排列组合公式/排列组合计算公式公式P是指排列,从N个元素取R个进行排列。公式C是指组合,从N个元素取R个,不进行排列。N-元素的总个数R参与选择的元素个数!-阶乘,如 9!=9*8*7*6*5*4*3*2*1从N倒数r个,表达式应该为n*(n-1)*(n-2)..(n-r+1); 因为从n到转载 2016-09-12 16:04:49 · 789 阅读 · 0 评论 -
机器学习(2)数学基础知识-线程代数
原文地址:http://blog.youkuaiyun.com/longxinchen_ml/article/details/51629328作者:Zico Kolter (补充: Chuong Do) 时间:2016年6月翻译:@MOLLY(mollyecla@gmail.com) @OWEN(owenj1989@126.com)校正:@寒小阳(hanx转载 2017-12-05 14:08:51 · 1240 阅读 · 0 评论