
Python
一抹烟霞
这个作者很懒,什么都没留下…
展开
-
Matplotlib快速上手
文章目录一、Matplotlib图表各个部分详解二、图表窗口2.1 直接生成图表 plt.show()2.2 魔法函数,嵌入图表%matplotlib inline2.3 魔法函数,弹出可交互的matplotlib窗口2.4 魔法函数,弹出matplotlib控制台2.5 关闭窗口和清空图表内容三、图表的基本元素3.1图名,图例,轴标签,轴边界,轴刻度,轴刻度标签等3.2 网格、刻度、注释参数设置3.3 线型 linestyle3.4 点型 marker3.5 color参数三、图表保存输出Matplot原创 2020-06-19 10:54:16 · 523 阅读 · 0 评论 -
Pandas —— (8)数据读取
文章目录一、读取普通分隔数据:read_table二、读取excel数据:read_excel三、读取csv数据:read_csv打赏一、读取普通分隔数据:read_table可以读取txt,csvdata1 = pd.read_table('data1.txt', delimiter=',',header = 0, index_col=1)print(data1)# delimiter:用于拆分的字符,也可以用sep:sep = ','# header:用做列名的序号,默认为0(第一行)#原创 2020-06-18 20:14:41 · 233 阅读 · 0 评论 -
Pandas —— (7)数据分组
文章目录一、分组二、函数计算打赏分组统计 - groupby功能根据某些条件将数据拆分成组对每个组独立应用函数将结果合并到一个数据结构中Dataframe在行(axis=0)或列(axis=1)上进行分组,将一个函数应用到各个分组并产生一个新值,然后函数执行结果被合并到最终的结果对象中。df.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, **kwar原创 2020-06-18 20:06:48 · 238 阅读 · 0 评论 -
Pandas —— (6)多个DataFrame的合并、连接、去重、替换
文章目录一、merge合并 → 类似excel的vlookup1.1 参数on → 参考键1.2 参数how → 合并方式1.3 参数 left_on, right_on, left_index, right_index → 当键不为一个列时,可以单独设置左键与右键二、concat连接三、duplicated去重四、replace替换打赏Pandas具有全功能的,高性能内存中连接操作,与SQL等关系数据库非常相似pd.merge(left, right, how=‘inner’, on=None, l原创 2020-06-18 19:42:13 · 14026 阅读 · 1 评论 -
Pandas —— (5)文本数据处理
文章目录一、常用方法二、去掉空格strip三、替换replace四、拆分split、rsplit五、字符串索引打赏一、常用方法通过str访问,且自动排除丢失/ NA值s = pd.Series(['A','b','C','bbhello','123',np.nan,'hj'])df = pd.DataFrame({'key1':list('abcdef'), 'key2':['hee','fv','w','hija','123',np.nan]})# 直接通过原创 2020-06-18 17:36:14 · 242 阅读 · 0 评论 -
Pandas —— (4)常用数学、统计方法
文章目录基本参数:axis、skipna主要数学计算方法唯一值:.unique(),去重值计数:.value_counts()成员资格:.isin()打赏和numpy的操作基本一致基本参数:axis、skipna# 基本参数:axis、skipnaimport numpy as npimport pandas as pddf = pd.DataFrame({'key1':[4,5,3,np.nan,2], 'key2':[1,2,np.nan,4,5],原创 2020-06-18 17:02:58 · 301 阅读 · 0 评论 -
Pandas —— (3)数据查看、转置、添加、修改、删除、运算(对齐)、排序
文章目录一、数据查看、转置二、添加与修改三、删除 del / drop()四、基本运算,自动对齐五、排序5.1 按值(列)排序 .sort_values5.2 按索引(行)排序 .sort_index打赏一、数据查看、转置# 数据查看、转置df = pd.DataFrame(np.random.rand(16).reshape(8,2)*100, columns = ['a','b'])print(df.head(2))# .head()查看头部数据pri原创 2020-06-18 16:44:47 · 752 阅读 · 0 评论 -
Pandas —— (2)索引与切片
文章目录一、索引1.1 列索引:df['列名'] (Series不存在列索引)1.2 行索引:1.3 bool型索引1.4 多重索引:比如同时索引行和列二、切片打赏一、索引Series和Datafram索引的原理一样,我们以Dataframe的索引为例1.1 列索引:df[‘列名’] (Series不存在列索引)df = pd.DataFrame(np.random.rand(12).reshape(3,4)*100, index = ['one','two原创 2020-06-18 16:20:35 · 576 阅读 · 0 评论 -
Pandas —— (1)基础数据结构概念和创建
文章目录一、Pandas简介1.1 数据结构1.2 大小可变与数据复制二、Series 数据结构2.1 Series简介2.2 Series 创建方法2.2.1 由字典创建2.2.2 由数组创建(一维数组)三、Dataframe数据结构3.1 Dataframe简介3.2 Dataframe创建方法3.2.1 由数组/list组成的字典创建3.2.2 由Series组成的字典创建3.2.3 通过二维数组直接创建打赏一、Pandas简介1.1 数据结构1.2 大小可变与数据复制Pandas 所有原创 2020-06-18 15:43:12 · 215 阅读 · 0 评论 -
Numpy(4)—— 保存和导入文件
一、文件读写Numpy可以方便的进行文件读写,如下面这种格式的文本文件:# 使用np.fromfile从文本文件'housing.data'读入数据# 这里要设置参数sep = ' ',表示使用空白字符来分隔数据# 空格或者回车都属于空白字符,读入的数据被转化成1维数组d = np.fromfile('./work/housing.data', sep = ' ')二、文件保存Numpy提供了save和load接口,直接将数组保存成文件(保存为.npy格式),或者从.npy文件中读取数组。原创 2020-06-11 15:56:40 · 736 阅读 · 0 评论 -
Numpy(3)—— 线性代数相关函数
diag:以一维数组的形式返回方阵的对角线(或非对角线)元素,或将一维数组转换为方阵(非对角线元素为0)。# numpy.linalg 中有一组标准的矩阵分解运算以及诸如求逆和行列式之类的东西# np.linalg.diag 以一维数组的形式返回方阵的对角线(或非对角线)元素,# 或将一维数组转换为方阵(非对角线元素为0)e = np.diag(d)f = np.diag(e)print('d: \n{}'.format(d))print('e: \n{}'.format(e))pri.原创 2020-06-11 15:50:45 · 288 阅读 · 0 评论 -
Numpy —— (2)随机数np.random
文章目录一、创建随机ndarray数组二、随机打乱ndarray数组顺序三、随机选取元素打赏主要介绍创建ndarray随机数组以及随机打乱顺序、随机选取元素等相关操作的方法。一、创建随机ndarray数组创建随机ndarray数组主要包含设置随机种子、均匀分布和正态分布三部分内容,具体代码如下所示。设置随机数种子# 可以多次运行,观察程序输出结果是否一致# 如果不设置随机数种子,观察多次运行输出结果是否一致np.random.seed(10)a = np.random.rand(3, 3原创 2020-06-11 15:40:21 · 298 阅读 · 0 评论 -
Numpy —— (1)基础数据结构
文章目录一、简介二、创建ndarray数组一、简介Python中的list列表也可以非常灵活的处理多个元素的操作,但效率却非常低。与之比较,ndarray数组具有如下特点:ndarray数组中所有元素的数据类型相同、数据地址连续,批量操作数组元素时速度更快。而list列表中元素的数据类型可能不同,需要通过寻址方式找到下一个元素。ndarray数组支持广播机制,矩阵运算时不需要写for循环。Numpy底层使用c语言编写,内置并行计算功能,运行速度高于Python代码。二、创建ndarray数组原创 2020-06-11 14:32:30 · 626 阅读 · 0 评论 -
python自动划分txt文件数据的train_date和test_date
# Author Qian Chenglongimport tensorflow as tfimport numpy as npfile_name='input20181209.txt'with open(file_name+'_train.txt', 'w') as train_txt: with open(file_name+'_test.txt', 'w') as t...原创 2018-12-18 12:03:35 · 1041 阅读 · 0 评论 -
python-读取文件和计算文件行数
一、计算文件的行数最简单的办法是把文件读入一个大的列表中,然后统计列表的长度.如果文件的路径是以参数的形式filepath传递的,那么只用一行代码就可以完成我们的需求了: count = len(open(filepath,'rU').readlines())如果是非常大的文件,上面的方法可能很慢,甚至失效.此时,可以使用循环来处理: count = -1 ...转载 2018-12-18 11:55:46 · 11375 阅读 · 1 评论 -
python读写txt 和csv文件的数据
数据格式:1.1747056e+02 7.0496781e+01 4.9332011e+01 5.1852217e+01 6.2850201e+01 1.0344781e+02 8.3420580e+01 5.8524113e+01 0.0000000e+00 4.0000000e+00 4.0000000e+00 0.0000000e+00 2....原创 2018-12-15 23:47:23 · 507 阅读 · 0 评论