- 博客(6)
- 收藏
- 关注
原创 统计学习方法|决策树
决策树 (decision tree)一种基本的分类与回归方法。决策树在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。其主要优点是模型具有可读性,分类速度快。学习时,利用训练数据,根据损失函数最小化的原则建立决策树模型。预测时,对新的数据,利用决策树模型进行分类。决策树学习通常包括3个步骤:特征选择、决策树的生成和决策树的修剪。
2019-06-24 18:13:16
472
原创 统计学方法|朴素贝叶斯法
朴素贝叶斯 (naive Bayes)法是基于贝叶斯定理与特征是件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基于此模型,对给定的输入x. 利用贝叶斯定理求出后验概率最大的输出y。朴素贝叶斯法实现简单,学习与预测的效率都很高,是一种常用的方法。
2019-06-24 15:38:58
321
原创 统计学习方法|K近邻法
近邻法(k-nearest neighbor,k-NN)是一种基本分类与回归方法。k近邻法的输入为实例的特征向量,对应于特征空间的点;输出为实例的类别,可以取多类。k近邻法假设给定一个训练数据集,其中的实例类别己定。分类时,对新的实例,根据其k个最近邻的训练实例的类别,通过多数表决等方式进行预测。因此,近邻法不具有显式的学习过程。k近邻法实际上利用训练数据集对特征向量空间进行划分,并作为其分类的“模型”。
2019-06-24 13:31:26
330
原创 统计学习方法|感知机
感知机是二分类的线性分类模型,由Rosenblatt于1957年提出,它是神经网络和支持向量机的基础。其输入为实例的特征向量,输出为实例的类别,取+1和-1二值。感知机对应于输入空间(特征空间)中将实例划分为正负两类的分离超平面,属于判别模型。感知机学习旨在求出将训练数据进行线性划分的分离超平面,为此,导入基于误分类的损失函数,利用梯度下降法对损失函数进行极小化,求得感知机模型。
2019-06-20 21:37:48
206
原创 统计学习方法知识总结
统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,也称统计机器学习。 统计学习的对象是数据,它从数据出发,提取数据的特征,抽象出数据的模型,发现数据中的知识,又回到对数据的分析与预测中去。统计学习关于数据的基本假设是同类数据具有一定的统计规律性,这是统计学习的前提。统计学习是一门概率论、统计学、信息论、计算理论、最优化理论及计算机科学等多个领域的交叉学科。
2019-06-20 13:36:43
838
原创 泰坦尼克号获救预测(针对anaconda中运行遇到的问题的解决办法)
@机器学习实战(五) kaggle练习赛 泰坦尼克获救预测一、 读取数据,观察数据分布import pandas #ipython notebooktitanic = pandas.read_csv(“titanic_train.csv”)print(titanic.head(5))print (titanic.describe())#查看每一列的情况print(titanic.sha...
2019-06-15 15:02:13
1172
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人