
python
文章平均质量分 53
糖甜甜甜74
个人公众号:DataGo数据狗
展开
-
Sklearn ValueError: empty vocabulary; perhaps the documents only contain stop words
中文语料: CountVectorizer(lowercase=False) 报错: CountVectorizer(token_pattern='(?u)\\b\\w\\w+\\b')原创 2019-03-26 15:36:42 · 5154 阅读 · 7 评论 -
Python进行数据分析探索
1.1 导入相应的包和数据%matplotlib inline #在jupyter里面需要加入此命令显示图import pandas as pd import matplotlib.pyplot as plt from sklearn.linear_model import RANSACRegressor, LinearRegression, TheilSenRegressor from sklea原创 2018-04-22 14:59:14 · 2422 阅读 · 2 评论 -
机器学习实战之决策树
简介:决策树是一类常见的机器学习方法,以二分类任务为例,我们希望从给定训练数据集学得一个模型用以对新数据进行分类,比如通过一组数据通过模型训练得到以下的决策树: 理论:决策树学习的关键是如何选择最优划分属性,一般而言,随着划分过程不断进行,我们希望决策树的分支结点所包含的样本尽可能属于同一类别,即结点的“纯度”越来越高。1、信息熵熵定义为信息的期望值,在明晰这个概念之前,我们必须知道信息的定义。如原创 2017-12-29 11:58:49 · 567 阅读 · 0 评论 -
机器学习实战之朴素贝叶斯
机器学习实战之朴素贝叶斯朴素贝叶斯分类器基于一个简单的假定:给定目标值时属性之间相互条件独立。1.1 简介贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。已知某条件概率,如何得到两个事件交换后的概率,也就是在已知P(A|B)的情况下如何求得P(B|A)。这里先解释什么是条件概率:P(A|B)表示事件B已经发生的前提下,事件A发生的概率,叫做事件B发生下事件A的条件概原创 2018-01-02 11:26:53 · 590 阅读 · 0 评论 -
numpy中的易混淆点
论numpy中matrix 和 array的区别:Numpy matrices必须是2维的,但是 numpy arrays (ndarrays) 可以是多维的(1D,2D,3D····ND). Matrix是Array的一个小的分支,包含于Array。所以matrix 拥有array的所有特性。在numpy中matrix的主要优势是:相对简单的乘法运算符号。例如,a和b是两个matrices,那么a原创 2017-12-21 11:12:26 · 525 阅读 · 0 评论 -
决策树可视化环境搭建
scikit-learn中决策树的可视化一般需要安装graphviz。主要包括graphviz的安装和python的graphviz插件的安装。 第一步是安装graphviz。下载地址在:http://www.graphviz.org/,如果下载grahviz-2.38.msi文件,注意安装的时候选择 for everyone,装完后都要设置环境变量,将graphviz的bi原创 2017-07-04 23:00:39 · 760 阅读 · 0 评论 -
python异常处理
python异常处理这里主要讨论在python中,遇到异常时处理。原创 2017-10-20 21:42:12 · 668 阅读 · 0 评论 -
python文件打开方式——a、a+、r+、w+
关于a、a+、r+、w+的区别已经明白了,但是最容易弄混的一个点就是文件指针问题,图一和图二的区别在于f.seek(0),这个方法可使指针指向文件开头,所以这样做之后的read方法才能从头读。或者采用先关闭再读取,也能从头开始读取。f.tell( )表示文件操作当前的指针位置。 转载自http://blog.cs转载 2017-04-01 12:27:43 · 1297 阅读 · 0 评论 -
python Index方法:
Index每次只返回查找范围的第一个索引值。 Index(value,[start,[stop]])中括号代表可选参数,在引用是不加中括号。 Eg: a=[1,2,3,4,5,6,7,8,2,5,7] a.index(2,2)表示从第三个位置开始查找出元素值是2的第一个索引值。原创 2017-03-30 11:51:00 · 2831 阅读 · 1 评论 -
数据可视化发现[吃鸡]秘密
大吉大利,今晚吃鸡~ 今天跟朋友玩了几把吃鸡,经历了各种死法,还被嘲笑说论女生吃鸡的100种死法,比如被拳头抡死、跳伞落到房顶边缘摔死 、把吃鸡玩成飞车被车技秀死、被队友用燃烧瓶烧死的。这种游戏对我来说就是一个让我明白原来还有这种死法的游戏。但是玩归玩,还是得假装一下我沉迷学习,所以今天就用吃鸡比赛的真实数据来看看如何提高你吃鸡的概率。 那么我们就用python和R做数据分析来回答以下的灵魂发问...原创 2019-03-26 15:57:42 · 1219 阅读 · 0 评论