
机器学习
文章平均质量分 96
机器学习
tzyyy1
有时候不在线,有问题或许您可以加我QQ一起交流:3154546513,备注优快云
展开
-
机器学习四(学习笔记) 回归算法(转)
回归算法回归是统计学中最有力的工具之一。机器学习监督学习算法分为分类算法和回归算法两种,其实就是根据类别标签分布类型为离散型、连续性而定义的。回归算法用于连续型分布预测,针对的是数值型的样本,使用回归,可以在给定输入的时候预测出一个数值,这是对分类方法的提升,因为这样可以预测连续型数据而不仅仅是离散的类别标签。回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归...原创 2018-12-18 16:39:41 · 2353 阅读 · 0 评论 -
机器学习三(学习笔记) 朴素贝叶斯和随机森林1.2(转)
一、朴素贝叶斯朴素贝叶斯(Naive Bayes)是一个非常简单,但是实用性很强的分类模型。朴素贝叶斯分类器的构造基础是贝叶斯理论。1、概率论基础概率定义为一件事情发生的可能性。事情发生的概率可以 通过观测数据中的事件发生次数来计算,事件发生的概率等于改事件发生次数除以所有事件发生的总次数。举一些例子:扔出一个硬币,结果头像朝上某天是晴天某个单词在未知文档中出现我们将事件的概...原创 2018-12-18 16:36:40 · 3696 阅读 · 0 评论 -
机器学习二(学习笔记) sklearn数据集及K近邻算法(转)
机器学习应用程序的步骤(1)收集数据我们可以使用很多方法收集样本护具,如:公司自有数据制作网络爬虫从网站上抽取数据、第三方购买的数据合作机构提供的数据从RSS反馈或者API中得到信息、设备发送过来的实测数据。(2)准备输入数据得到数据之后,还必须确保数据格式符合要求。(3)分析输入数据这一步的主要作用是确保数据集中没有垃圾数据。如果是使用信任的数据来源,那么可以直接跳过这个步...原创 2018-12-17 12:00:03 · 2054 阅读 · 0 评论 -
机器学习一(学习笔记) 数据的特征抽取及预处理
Scikit-learn安装Scikit-learnpip3 install Scikit-learnpip3 install scipy一、数据的特征抽取现实世界中多数特征都不是连续变量,比如分类、文字、图像等,为了对非连续变量做特征表述,需要对这些特征做数学化表述,因此就用到了特征提取. sklearn.feature_extraction提供了特征提取的很多方法1、字典数据抽取...原创 2018-12-17 11:59:38 · 4254 阅读 · 0 评论