
python学习
erinapple
这个作者很懒,什么都没留下…
展开
-
pycharm中查看内建函数源码
在写代码的过程中,有的不常用的函数会忘记其具体用法,可以使用pycharm来查看源码,帮助自己重新想起来具体的使用方法:鼠标放在内建函数上,Ctrl+B,看源码点击需要查看源码的函数名,按住Ctrl+B自动跳转即可...转载 2019-01-22 15:34:35 · 689 阅读 · 0 评论 -
评测指标 confusion_matrix 混淆矩阵
from sklearn.metrics import confusion_matriximport matplotlib.pyplot as plty_test = [0, 0, 0, 0, 0, 1, 1, 1, 1, 1]y_pred = [0, 1, 0, 0, 0, 0, 0, 1, 1, 1]confusion_matrix=confusion_matrix(y_test,y_...翻译 2018-06-26 16:10:28 · 1416 阅读 · 0 评论 -
python 实现交叉验证的几个函数以及之前的区别
Stratified k-foldStratifiedKFold()这个函数较常用,比KFold的优势在于将k折数据按照百分比划分数据集,每个类别百分比在训练集和测试集中都是一样,这样能保证不会有某个类别的数据在训练集中而测试集中没有这种情况,同样不会在训练集中没有全在测试集中,这样会导致结果糟糕透顶。 train_test_split随机根据比例分配训练集和测试集。这个函数可以调整随机种子。...转载 2018-06-26 15:57:49 · 1220 阅读 · 0 评论 -
python 数据处理 数组拼接concatenate
concatenate 是numpy 下一个函数在处理数据的时候,经常会将训练集和验证集放在一起,进行特征处理,此时可以使用这个函数输入:import numpy as npx = [[1, 2], [3, 4]]x1 = np.concatenate([x, x], axis=0)print("x1 axis=0")print(x1)x2 = np.concatenate(...转载 2018-06-26 15:57:28 · 6356 阅读 · 0 评论 -
useful
http://www.cnblogs.com/vijayfly/p/6031414.htmlpandas dataframe.apply() 实现对某一行/列进行处理获得一个新行/新列2018-01-24 20:30 by ZealouSnesS, 2109 阅读, 0 评论, 收藏, 编辑重点:dataframe.apply(function,axis)对一行或一列做出一些操作(axis=1则为...转载 2018-06-19 18:21:26 · 122 阅读 · 0 评论 -
pandas 如何将一列的文字划分为多行
https://blog.youkuaiyun.com/guankangqiang/article/details/80390816我在处理数据,不知道如何拆分多行,然后百度了很多,发现这种方法还挺好的转:https://zhuanlan.zhihu.com/p/28337202来自微信公众号“Python数据之道”在数据处理过程中,经常会遇到以下类型的数据:在同一列中,本该分别填入多行中的数据,被填在一行里...翻译 2018-06-19 18:16:54 · 2514 阅读 · 0 评论 -
python 的一些常用的用法
重点:dataframe.apply(function,axis)对一行或一列做出一些操作(axis=1则为对某一列进行操作,此时,apply函数每次将dataframe的一行传给function,然后获取返回值,将返回值放入一个series)python去空格:字符串.strip()待解决:dataframe.assign()应该怎么用?(1)读入数据后先把 城市 那一列城市名中的空格去掉对一列...翻译 2018-06-19 17:42:29 · 270 阅读 · 0 评论 -
删除DataFrame中值全为NaN或者包含有NaN的列或行?
删除DataFrame中值全为NaN或者包含有NaN的列或行?2016年12月19日 16:41:47阅读数:17963如果存在以下DataFrame 年龄 性别 手机号0 2 男 NaN1 3 女 NaN2 4 NaN Na...翻译 2018-06-19 10:43:58 · 11543 阅读 · 0 评论 -
python中的size,shape,len,count
len():返回对象的长度比如len([1,2,3]),返回值为3count():计算包含对象个数比如[1,1,1,2].count(1),返回值为3sum():做一个和运算比如sum([1,2,3]),返回值为6size()函数是返回分组大小的Series。size()和shape () 是numpy模块中才有的函数size():计算数组和矩阵所有数据的个数 a = np.array([[1,2...原创 2018-05-13 21:04:49 · 5582 阅读 · 0 评论 -
数据处理中的二值化LabelBinarizer()
阅读数:126在多数的机器学习比赛中,给出的标签都是非数字化的,所以我们需要对其进行转换。代码如下:from sklearn import preprocessingfeature = [[0,1], [1,1], [0,0], [1,0]]label= ['yes', 'no', 'yes', 'no']lb = preprocessing.LabelBinarizer() #构建一个转换...翻译 2018-06-26 16:27:48 · 3681 阅读 · 0 评论 -
python read_csv 使用
https://blog.youkuaiyun.com/overstack/article/details/9001849上述连接很重要,看一下https://blog.youkuaiyun.com/overstack/article/details/9001849In [1021]: print open('foo.csv').read()date,A,B,C20090101,a,1,220090102,b,3,...原创 2018-06-26 17:15:11 · 3314 阅读 · 0 评论 -
python中的过滤函数 filter()
filter( , )该函数有两个参数,第一个参数是一个函数,第二个是一个序列,函数的返回值是使得第一个参数中的函数为true的序列中的元素def is_odd(n): return n % 2 == 1new_list = list(filter(is_odd, [1, 2, 3, 4, 5, 6, 7, 8]))print(new_list)上述可以返回[1, 3, 5, 7]...原创 2018-06-26 17:38:44 · 4463 阅读 · 0 评论 -
装饰器@
http://python.jobbole.com/80955/转载 2019-01-18 15:10:39 · 220 阅读 · 0 评论 -
dataframe性质
1)查看DataFrame数据及属性df_obj = DataFrame() #创建DataFrame对象df_obj.dtypes #查看各行的数据格式df_obj['列名'].astype(int)#转换某列的数据类型df_obj.head() #查看前几行的数据,默认前5行df_obj.tail() #查看后几行的数据,默认后5行df_obj.index #查看索引df_...转载 2018-10-26 15:38:52 · 541 阅读 · 0 评论 -
python 中的struct 类型
准确地讲,Python没有专门处理字节的数据类型。但由于str既是字符串,又可以表示字节,所以,字节数组=str。而在C语言中,我们可以很方便地用struct、union来处理字节,以及字节和int,float的转换。在Python中,比方说要把一个32位无符号整数变成字节,也就是4个长度的str,你得配合位运算符这么写:>>> n = 10240099>>...转载 2018-08-15 20:25:21 · 1784 阅读 · 0 评论 -
.loc,.iloc,.ix python
python 中根据位置取值.loc,.iloc,.ix还可以通过每一行的索引和列的索引,把需要的行和列单独取出来.loc主要是针对字符串的,当索引是字符串那么就用.loc,如果索引是数字,就用iloc[python] view plain copyimport numpy as np import pandas as pd df = pd.DataFrame(np.arange(0,60,2...转载 2018-07-05 14:57:58 · 697 阅读 · 0 评论 -
numpy中argsort()函数的用法以及sort(),sorted()
argsort函数返回的是数组值从小到大的索引值,是numpy中的函数python的内建排序函数有 sort、sorted两个。1、基础的序列升序排序直接调用sorted()方法即可1 ls = list([5, 2, 3, 1, 4])2 new_ls = sorted(ls)或者使用ls.sort()即可,直接将ls改变3 print(new_ls)需要注意:sort()方法仅定义在lis...翻译 2018-06-28 10:10:37 · 1937 阅读 · 0 评论 -
python 中 np.where
python或者numpy中能够返回符合某一条件的下标的函数是np.where(),不过np.where()并不接受list类型的参数,可见np.where()既可以接收三个参数,用于三目运算,也可接收一个参数,返回符合条件的下标。>>a = np.array(a)>>aarray([1, 2, 3, 1, 2, 3, 1, 2, 3])>>idx = n...翻译 2018-06-28 09:37:20 · 14822 阅读 · 0 评论 -
WOE python手写代码
http://www.sohu.com/a/227312722_479788转载 2018-06-27 18:27:42 · 1241 阅读 · 0 评论 -
Python time strftime()方法
描述Python time strftime() 函数接收以时间元组,并返回以可读字符串表示的当地时间,格式由参数format决定。语法strftime()方法语法:time.strftime(format[, t])参数format -- 格式字符串。t -- 可选的参数t是一个struct_time对象。返回值返回以可读字符串表示的当地时间。说明python中时间日期格式化符号:%y 两位数的...原创 2018-07-08 22:21:30 · 831 阅读 · 0 评论 -
seaborn python 数据可视化的一种利器
from __future__ import divisionimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns1234561、定性调色板 Qualitative默认的定性调色板:deep, muted, pastel, bright, dark, colorbl...原创 2018-07-08 22:19:38 · 239 阅读 · 0 评论 -
python 生成器2
将列表生成式中[]改成() 之后数据结构是否改变? 答案:是,从列表变为生成器>>> L = [x*x for x in range(10)]>>> L[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]>>> g = (x*x for x in range(10))>>> g<genera...原创 2018-05-03 23:15:10 · 123 阅读 · 0 评论 -
python format
之前在处理文本的时候,以及处理推荐数据集的时候用到format,当时只是觉得太好用,现在整理一下。格式化字符串的函数 str.format(),它增强了字符串格式化的功能。基本语法是通过 {} 和 : 来代替以前的 % 。format 函数可以接受不限个参数,位置可以不按顺序。>>>"{} {}".format("hello", "world") # 不设置指定位置,按默认...原创 2018-05-03 14:13:37 · 139 阅读 · 0 评论 -
list和set
前言 对于喜欢逛优快云的人来说,看别人的博客确实能够对自己有不小的提高,有时候看到特别好的博客想转载下载,但是不能一个字一个字的敲了,这时候我们就想快速转载别人的博客,把别人的博客移到自己的空间里面,当然有人会说我们可以收藏博客啊,就不需要转载,(⊙o⊙)… 也对。。实现 因为我自己当初想转载的时候却不知道该怎么转载,所以学会了之后就把方法写出来,帮助那些想转载却不知道该怎么转载的人(大神勿笑转载 2017-10-12 17:06:10 · 291 阅读 · 0 评论 -
349. Intersection of Two Arrays 需要的python基础
列表list列表List可以包含不同类型的数据对像,同时它是一个有序的集合切片列表元素支持用索引访问,正向索引从0开始 colors=["red","blue","green"] colors[0] =="red" colors[1]=="blue" 切片操作不是列表特有的,python中的有序序列都原创 2017-10-12 11:31:55 · 278 阅读 · 0 评论 -
python中的字典详细介绍
主键是表行数据的唯一标识,具有唯一性和非空属性,索引主要作用是用于查询,提供查询速度的。#键与索引的区别字典的组成:字典是由大括号{ }来包含其数据的,大括号内包含键和其对应的值,一对键和值成为一个项。键和值用冒号:隔开,项和项之间用逗号,号隔开。空字典就是不包含任何项的大括号,像{ }这样就是一个空字典。http://www.iplaypy.com/jichu/dict.htm原创 2017-10-10 23:09:05 · 495 阅读 · 0 评论 -
python定义类(class)的语法,
定义类(class)的语法class Iplaypython: #类的名字,首字母,有一个不可文的规定,最好是大写,这样需要在代码中识别区分每个类。>>> def fname(self, name): #第二行开始是类的方法,大家看到了,和函数非常相似,但是与普通函数不同的是,它的内部有一个“self”,参数,它的作用是对于对象自身的引用。>>>原创 2017-10-10 22:33:00 · 2704 阅读 · 0 评论 -
Python变量类型(l整型,长整形,浮点型,复数,列表,元组,字典)学习
python的字串列表有2种取值顺序:从左到右索引默认0开始的,最大范围是字符串长度少1从右到左索引默认-1开始的,最大范围是字符串开头已经表示为字符串形式的输出的时候直接输出即可,字符串之间的链接也是直接使用加号‘#Python数字,python支持四种不同的数据类型 int整型 long长整型 float浮点型 complex复数var1 = 10; #表示整型var2原创 2017-09-26 23:08:15 · 2315 阅读 · 0 评论 -
python书写
原创 2017-09-15 10:55:13 · 234 阅读 · 0 评论 -
python KNN中使用到的函数表达式
readline() 方法用于从文件读取整行,包括 "\n" 字符。如果指定了一个非负数的参数,则返回指定大小的字节数,包括 "\n" 字符。.readline() 和 .readlines() 之间的差异是后者一次读取整个文件,象 .read() 一样。.readlines() 自动将文件内容分析成一个行的列表,该列表可以由 Python 的 for ... in ... 结构进行处理。另一原创 2017-08-17 22:02:43 · 578 阅读 · 0 评论 -
python argsort()排序
argsort函数返回的是数组值从小到大的索引值·1、argsort()函数,是numpy库中的函数下面的不想写了,直接复制过来留个档! argsort函数argsort函数返回的是数组值从小到大的索引值Examples--------One dimensional array:一维数组>>> x = np.array([3, 1, 2])>原创 2017-08-17 20:50:46 · 2158 阅读 · 5 评论 -
itemgetter对列表排序
operator.itemgetter函数operator模块提供的itemgetter函数用于获取对象的哪些维的数据,参数为一些序号。看下面的例子a = [1,2,3] >>> b=operator.itemgetter(1) //定义函数b,获取对象的第1个域的值>>> b(a) 2>>> b=operator.itemgetter(1,0) //定义函数b原创 2017-08-17 20:43:51 · 432 阅读 · 0 评论 -
pycharm
http://blog.youkuaiyun.com/chenggong2dm/article/details/93668051,新建一个项目File --> New Project右键单击刚建好的helloWord项目,选择New --> Python File要是运行的时候出现edit configuration 那么将python的编辑器导入原创 2017-10-23 20:54:08 · 264 阅读 · 0 评论 -
文章标题
最全Pycharm教程(12)——Pycharm调试器之Java脚本调试 <div class="article_manage clearfix"> <div class="article_l"> <span class="link_categories"> 标签: <a转载 2017-10-23 21:15:46 · 414 阅读 · 0 评论 -
生成器 python
Python使用生成器对延迟操作提供了支持。所谓延迟操作,是指在需要的时候才产生结果,而不是立即产生结果。这也是生成器的主要好处。生成器最大的优点在于延迟操作,使用的内存更少Python有两种不同的方式提供生成器:生成器函数:常规函数定义,但是,使用yield语句而不是return语句返回结果。yield语句一次返回一个结果,在每个结果中间,挂起函数的状态,以便下次重它离开的地方继续执行生成器表达...原创 2018-05-03 11:04:34 · 153 阅读 · 0 评论 -
python os
os 模块提供了一个统一的操作系统接口函数, 这些接口函数通常是平台指定的,os 模块能在不同操作系统平台如 nt 或 posix中的特定函数间自动切换,从而能实现跨平台操作 1.文件操作 build-in函数 open 实现文件创建, 打开, 修改文件的操作 import os import string def replace(file, search_for, replace_转载 2018-01-19 17:27:57 · 278 阅读 · 0 评论 -
K折交叉验证
如何确定合适的k值K 值越小,偏误越大,所以越不推荐。(K 值小,则会变得像“验证集法”)K 值太大,所得结果会变化多端。(K 值大,则会变得像“留一法”(LOOCV))通常建议的值是 k=10 。如何衡量模型的偏误/变化程度?K 层交叉检验之后,我们得到 K 个不同的模型误差估算值(e1, e2 …..ek)。理想的情况是,这些误差值相加得 0 。要计算模原创 2017-10-25 22:08:07 · 712 阅读 · 0 评论 -
list 的用法
list 在python 中使用较多,在取数据的时候一般是从下标0开始list1 = ['physics','chemistry',1997, 2000];list2 =[1,2, 3, 4,5, 6, 7];print"list1[0]: ", list1[0]print"list2[1:5]: ", list2[1:5]lis原创 2017-10-26 16:02:21 · 463 阅读 · 0 评论 -
python文件地址问题
在写python的时候,path地址不对因为我是直接将地址复制黏贴的,一般来说,\在编程语言中代表的是转义字符,要表示我的地址,要在前面再加一个\原创 2017-10-26 15:44:48 · 861 阅读 · 0 评论 -
交叉验证(Cross validation)
交叉验证(Cross validation)交叉验证用于防止模型过于复杂而引起的过拟合(作用)如何交叉验证:我这里主要介绍K交叉验证1 将数据集分成K份2 对于每一个模型(拿多项式回归举例, m=2为一个模型,m=3为一个模型。。。我们主要就是寻找最好的m){也就是m每次取一个值的时候} for j=1,2,...,k 将除第j份的所有数据作为训原创 2017-10-25 21:54:50 · 694 阅读 · 0 评论