python学习
在路上_2018
功夫再高,也怕菜刀。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
豆瓣评论数据词云画像()
-- coding:utf-8 --‘’’这段代码是从一个网站借用过来的,具体哪个网址一下子忘记了。可以直接运行。‘’’from selenium import webdriverimport timeimport codecsimport jiebaimport jieba.analyse as analysefrom wordcloud import WordCloudf...转载 2018-11-03 20:54:21 · 868 阅读 · 0 评论 -
PIP下载国内镜像
参考网址:https://www.cnblogs.com/microman/p/6107879.htmlpip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyspider,这样就会从清华这边的镜像去安装pyspider库。转载 2019-02-12 22:14:03 · 1139 阅读 · 0 评论 -
解决to_csv存储效率低的一个方案
总所周知,pandas在分析领域给我们提供一个很好用的包,当然,如果我们的数据量很大,使用df.to_csv效率很低的时候我们可以使用pickle序列化来进行替代(小数据怎么都行,如果通过to_csv存储的文件达到1G左右的时候,那真的是存储的急人)关于pickle的详细使用可以参考网址:http://www.cnblogs.com/lincappu/p/8296078.html附上代码:...原创 2019-02-10 17:43:03 · 4185 阅读 · 2 评论 -
python的file,time的一些知识点
1,open 和 with open的区别open是手动打开,不需要的就需要关闭,不关闭可能会发现未知的错误with open是自动打开,不需要的python会自动关闭2,遍历文本数据files = open('python.txt','r',encoding='utf-8')for line in files : print(line) files.close()`这样相对...原创 2018-12-13 14:20:32 · 637 阅读 · 0 评论 -
pandas中的stack,unstack和numpy,stack,hstack,vstack通俗理解
在网上看上很多关于numpy中stack的复杂解释,其实他的实际含义和用法很简单,被人理解复杂了,当然,我们先看pandas的用法:1,在我们常见的数据层次化结构分为两种,一种是花括号(一维数据),一种是表格(二维度数据),这个参考了如下网址https://www.cnblogs.com/bambipai/p/7658311.html左边的是一维结构(类似于Series结构),右边的是二维结...原创 2018-11-25 16:18:40 · 4332 阅读 · 0 评论 -
透视表的用法python
参考网址:https://blog.youkuaiyun.com/moxigandashu/article/details/694862691,交叉表(index,columns必须要给定)# index和columns是必须要指定的参数,margin为汇总项目,可以不要(也可以重命名)pd.crosstab(df.deptno,df.sal,margins=True) 2,透视表 piv...原创 2018-11-25 10:39:04 · 328 阅读 · 0 评论 -
loc,iloc,列索引,布尔索引的使用
结论:1,loc,iloc,df.ename,df[‘ename’],df[[‘ename’]]都是引用的方式进行访问,也就是说被引用的数据发生改变,那么df数据也会发生改变2,如果只拿一列(一个特征值)数据,那么返回的一般是Series类型,达到两列或者以上,一般是Dataframe类型3,loc[0:1,:],iloc[0:1,:],对于loc是location的缩写,iloc中的i是i...原创 2018-11-26 09:02:21 · 419 阅读 · 0 评论 -
loc,iloc,列索引,布尔索引的使用
结论:1,loc,iloc,df.ename,df[‘ename’],df[[‘ename’]]都是引用的方式进行访问,也就是说被引用的数据发生改变,那么df数据也会发生改变2,如果只拿一列(一个特征值)数据,那么返回的一般是Series类型,达到两列或者以上,一般是Dataframe类型3,loc[0:1,:],iloc[0:1,:],对于loc是location的缩写,iloc中的i是i...原创 2018-11-26 09:02:21 · 1989 阅读 · 0 评论 -
三种增加DataFrame行的办法
第一种:在网上看到的,可以直接使用,python3.x的环境:from pandas import *from random import *df = DataFrame(columns=('lib', 'qty1', 'qty2')) # 生成空的pandas表for i in range(6): # 插入一行 df.loc[i] = [randint(-1, 1) for ...原创 2018-11-24 22:43:38 · 47352 阅读 · 1 评论 -
python的concat等用法
1,numpy中的concatenate()函数:>>> a = np.array([[1, 2], [3, 4]])>>> b = np.array([[5, 6]])>>> np.concatenate((a, b), axis=0)array([[1, 2], [3, 4], [5, 6]])&...原创 2018-11-25 19:01:53 · 64784 阅读 · 1 评论 -
mmap的简单使用
参考网址:http://www.cnblogs.com/zhoujinyi/p/6062907.htmlhttp://www.cnblogs.com/huxiao-tee/p/4660352.html内存映射模块的使用mmap是一种虚拟内存映射的方法,好比:内存放目录,磁盘放数据,实现相对的快速读取# 下面对这段代码进行详细的说明:# m=mmap.mmap(fileno, lengt...原创 2018-11-22 20:56:07 · 1063 阅读 · 0 评论 -
不同进制转换,bytes和str的转换
参考网址:http://www.cnblogs.com/hushaojun/p/7681148.html1,函数说明(帮助文档):oct() Return the octal representation of an integer.bin():Return the binary representation of an integer.ord() :Return the Unicode ...原创 2018-11-22 11:53:29 · 1205 阅读 · 0 评论 -
join函数的使用
Python中有join()和os.path.join()两个函数,具体作用如下:join(): 连接字符串数组。将字符串、元组、列表中的元素以指定的字符(分隔符)连接生成一个新的字符串os.path.join(): 将多个路径组合后返回# 1:join()函数的使用li1 = ['nihao','xiao','nidaye'] # 对于元祖来说也是一样print(' '.joi...原创 2018-11-22 11:26:16 · 3261 阅读 · 0 评论 -
yeild的一些使用
参考网址:https://www.pythoncentral.io/python-generators-and-yield-keyword/https://stackoverflow.com/questions/519633/lazy-method-for-reading-big-file-in-python1,yield就好比是生成迭代器的关键字,迭代器在需要的时候才会去拿数据,所以,第二...原创 2018-11-21 17:15:40 · 390 阅读 · 0 评论 -
numpy中tril和triu的简单用法
参考网址:https://www.cnblogs.com/cymwill/p/7857456.html# https://www.cnblogs.com/cymwill/p/7857456.htmlimport numpy as nparr = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12], [13, 14, 15, 1...转载 2019-03-04 21:09:17 · 5132 阅读 · 0 评论
分享