
python
梦里却知是客
你的眼中 明暗交杂 画中的你 低头说话 不胜真假 不做挣扎 无谓笑话
展开
-
机器学习(一):监督学习与非监督学习
首先来一个大概的定义:监督学习:通过训练让机器自己找到特征和标签之间的联系(注:也就是学习的训练集包含输入和输出,得到了最优参数模型之后 ,新来的数据集在面对只有特征没有标签的情况下时,可以判断出标签)无监督学习:训练数据中只有特征没有标签,输入数据没有被标记,也没有确定的结果。样本数据类别未知,需要根据样本间的相似性对样本集进行分类。(注:不一定"分类",没有训练集,旨在寻找规律性,不予...原创 2019-04-13 11:21:39 · 704 阅读 · 0 评论 -
机器学习(十二):深度神经网络浅析
先阐述一些概念性的东西(也是对之前的东西的回顾,记性不好,老忘):回归问题与分类问题:回归:计算圆形面积的例子就属于回归问题,即我们的目的是对于一个输入x,预测其输出值y,且这个y值是根据x连续变化的值。分类:分类问题则是事先给定若干个类别,对于一个输入x,判断其属于哪个类别,即输出一般是离散的监督学习和无监督学习:监督学习:通过训练让机器自己找到特征和标签之间的联系(注:也就...原创 2019-04-23 17:42:57 · 650 阅读 · 0 评论 -
机器学习(六):初级matplitlib绘图-之前的微补充
将一张图绘制在另一张图的内部:fig = plt.figure() # 新建画板axes1 = fig.add_axes([0.1, 0.1, 0.8, 0.8]) # 大画布axes2 = fig.add_axes([0.2, 0.5, 0.4, 0.3]) # 小画布# 大画布axes1.plot(x, y, 'r')# 小画布axes2.plot(y, x, 'g')...原创 2019-04-18 19:01:33 · 438 阅读 · 0 评论 -
机器学习(五):初级matplitlib绘图-其他绘图样式和3维绘图
注(百度百科案例)使用二维数据集和其他一些数据:散点图:import numpy as npimport matplotlib as mplimport matplotlib.pyplot as pltnp.random.seed(2000)y = np.random.standard_normal((1000,2))plt.figure(figsize=(7,5))pl...原创 2019-04-18 18:43:02 · 508 阅读 · 0 评论 -
机器学习(四):初级matplitlib绘图-2维绘图
注:百度百科案例首先,我们必须导入对应的库。主要的绘图函数在子库matplotlib.pyplotimport numpy as npimport matplitlib as nmlimport matplotlib.pyplot as plt%matplotlib inline注:%matplotlib inline是再使用jupyter notebook或者jupyter...原创 2019-04-18 17:42:50 · 638 阅读 · 0 评论 -
机器学习(三):决策树,随机森林
树形模型是机器学习中最为常用的模型之一,其同KNN算法一样,也是弱假设型模型。而树形模型里面的决策树是bagging、随机森林以及boosting的基础,因此想要了解随机森林,首先要了解决策树:决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。常见的决策树算法有C4.5、ID3和CART。而一个树形模型经常包含以下定义:根节点...原创 2019-04-18 10:13:09 · 770 阅读 · 0 评论 -
机器学习(十一):新闻摘要提取小案例
注:基于现有案例教程完成一个相对简单的 “关键字提取” 算法,来达到最自然语言处理的一个初步的理解。词汇数据下载:http://labfile.oss.aliyuncs.com/courses/741/nltk_data.tar.gz也可以用下面的下载import nltknltk.download('stopwords')nltk.download('punkt')...原创 2019-04-22 18:59:11 · 1266 阅读 · 0 评论 -
机器学习(十):自然语言处理初级理解
什么是自然语言处理:NLP(Natural Language Processing,自然语言处理)当中所谓的「自然」是为了与人造的语言(比如 C 语言, JAVA 等)区分开来,指自然形成的语言,即平时人们日常使用的交流的语言。「语言」则是人类区别其他动物的本质特性。在所有生物中,只有人类才具有语言能力。人类的多种智能都与语言有着密切的关系。人类的逻辑思维以语言为形式,人类的绝大部分知识也是以...原创 2019-04-22 16:40:28 · 495 阅读 · 0 评论 -
机器学习(九):鸢尾花-逻辑回归
注:基于现有案例教程鸢尾花数据来源于seaborn中自带的数据集,很多类似的都会自带这个数据集代码如下:import pymc3 as pmimport pandas as pdimport scipy.stats as statsimport theano.tensor as ttimport seaborn as snsimport matplotlib.pyplot ...原创 2019-04-22 15:55:09 · 1473 阅读 · 0 评论 -
机器学习(二):线性回归浅谈
定义:线性回归:用一条直线较为准备的描述数据 之间的关系(注:通过属性的线性组合来进行预测的线性模型,找到一条直线或者一个 平面,使得预测值与真实值之间的误差最小,常见于房价的预测)特点:计算熵不复杂,但是对非线性的拟合并不好注:(建模速度快,不需要很复杂的计算,在数据量大的情况下依然运行速度很快。可以根据系数给出每个变量的理解和解释。对异常值很敏感。)问题:假定现有一个房价数...原创 2019-04-17 10:59:19 · 294 阅读 · 0 评论 -
机器学习(八):nba数据分析小案例
注:基于实验楼一个小项目数据下载地址:http://labfile.oss.aliyuncs.com/courses/782/data.zip代码如下:import pandas as pdimport mathimport csvimport randomimport numpy as npfrom sklearn import linear_modelfrom s...原创 2019-04-21 22:31:22 · 2419 阅读 · 1 评论 -
机器学习(七):k邻近算法初级浅析案例
注:基于现有小案例攥写K 近邻算法采用测量不同特征值之间的距离方法进行分类:优点:精度高、对异常值不敏感、无数据输入假定。缺点:计算复杂度高、空间复杂度高。K 近邻算法适用数据范围为:数值型和标称型标称型:标称型目标变量的结果只在有限目标集中取值,如真与假数值型:数值型目标变量则可以从无限的数值集合中取值,如0.100,42.001等工作原理:存在一个样本数据集合,也...原创 2019-04-19 16:08:17 · 207 阅读 · 0 评论