zi_ying123-优快云博客

原创 Numpy数据存取

Numpy数据存取numpy提供了便捷的内部文件存取，将数据存为np专用的npy(二进制格式)或npz(压缩打包格式)格式 npy格式以二进制存储数据的，在二进制文件第一行以文本形式保存了数据的元信息（维度，数据类型），可以用二进制工具查看查看内容 npz文件以压缩打包文件存储，可以用压缩软件解压import numpy as npa = np.array([['张三','李四','王五','赵六'],['11','12','13','14','15']])b = a = np.arang

2021-04-10 11:13:53 1235

原创 Pandas分类,&绘图, &时间序列

Pandas分类categorical data是指分类数据：数据类型为：男女、班级（一班、二班）、省份，使用赋值法给变量赋值，例如（男=1，女=0），数字1, 0之间没有大小之分，不能认为1是比0大的 numerical data是指数值型数据：收入（1000元，500元），是可以进行比较大小并进行运算的数据。从0.15版本开始，pandas可以在DataFrame中支持Categorical类型的数据，Pandas可以在DataFrame中包含分类数据df = pd.DataF..

2021-04-10 11:11:53 1411 1

原创 pandas数据操作,& 数据排序, & 数据类型运算

字符串方法Series对象在其str属性中配备了一组字符串处理方法，可以很容易的应用到数组中的每个元素t = pd.Series(['a_b_c_d','c_d_e',np.nan,'f_g_h'])tt.str.cat(['A','B','C','D'],sep=',') #拼接字符串t.str.split('_') #切分字符串t.str.get(0) #获取指定位置的字符串t.str.replace("_", ".") #替换字符串t.str.pad(10, fillc

2021-04-10 11:00:00 351

原创 Pandas统计分析, 数据存取

pandas数据的基本统计分析和numpy的函数近似dates = pd.date_range('20130101',periods=10)datesdf = pd.DataFrame(np.random.randn(10,4),index=dates,columns=['A','B','C','D'])dfdf.describe() #快速统计结果df.mean() # 按列求平均值df.mean(1) # 按行求平均值基本统计分析函数.describe()针对0轴(列.

2021-04-10 10:52:57 334 1

原创 Pandas缺失数据处理, 数据规整

Pandas用np.nan代表缺失数据reindex()可以修改索引，会返回一个数据的副本:df1 = df.reindex(index=dates[0:4], columns=['A','B','C','D','E'])df1df1 = df.reindex(index=dates[0:4], columns=['A','B','C','D']+['E'])df1df1 = df.reindex(index=dates[0:4], columns=list(df.columns)..

2021-04-10 10:50:08 131

原创【sed 命令详解】

sed 行文件编辑工具。因为它编辑文件是以行为单位的。命令格式详解命令格式： sed [参数] '<匹配条件> [动作]' [文件名] 注意：可以通过 sed --help 查看grep的帮助信息参数详解：参数为空表示sed的操作效果，实际上不对文件进行编辑 -i 表示对文件进行编辑注意：mac版本的bash中使用 -i参数，必须在后面单独加个东西： -i ' '匹配条件：匹配条件分为两种：数...

2020-11-21 13:57:20 2052

原创【pandas】DataFrame查增改删

DataFrame查增改删查 Read类list/ndarray数据访问方式dates = pd.date_range('20130101',periods=10)datesdf = pd.DataFrame(np.random.randn(10,4),index=dates,columns=['A','B','C','D'])df#索引df['A']df.Adf['A']['2013-01-01']#先列后行df.A['2013-01-01']df[['A','C']]

2020-11-14 14:27:12 210

原创【pandas】数据类型-DataFrame

数据类型-DataFrameDataFrame是由多个Series数据列组成的表格数据类型，每行Series值都增加了一个共用的索引既有行索引，又有列索引行索引，表明不同行，横向索引，叫index，0轴，axis=0 列索引，表名不同列，纵向索引，叫columns，1轴，axis=1 DataFrame数据类型可视为：二维带标签数组每列值的类型可以不同基本操作类似Series，依据行列索引操作常用于表达二维数据，但也可以表达多维数据(Dataframe嵌套，极少用)D

2020-11-14 14:25:48 479

原创 [pandas] 数据类型-Series

数据类型-SeriesSeries数据类型由一组数据和数据相关的索引组成，键 -> 值 Series数据类型可视为：一维带标签数组 Series基本操作类似数组和字典Series数据类型的创建首先载入库import numpy as npimport pandas as pdPython list列表创建Seriesa = pd.Series([1,2,3,4]) #默认索引b = pd.Series([1,2,3,4],index=['a','b','c',.

2020-11-14 14:23:36 343

原创【Pandas】简单介绍

Pandas(panel data & Data Analysis)：Python数据分析库。是基于Numpy的，专用于数据分析的Python第三方库，最适用于处理大型结构化表格数据Pandas最初是对冲基金公司开发出来做金融量化数据分析的Python库 Pandas借鉴了R的数据结构 Pandas基于Numpy搭建，支持Numpy中定义的大部分计算 Pandas提供了大量和其他技术交互的接口（比如IO工具 (CSV, XLSX, HDF5, ...)，可视化（封装pyplot）...

2020-11-14 14:21:56 365

原创 python下读取csv文件结果转换list

【Linux】Ubuntu16.04环境下git安装与配置Git：本地分支和远程分支建立追踪git branch --set-upstream-to=orign/<远程分支名> <本地分支名>

2020-11-14 13:06:30 2989

原创拉取线上更新代码到本地及提交本地代码到线上的流程

GIT在实际开发中，可能存在master dev分支，我们需要在dev分支下创建至今的分支进行开发操作创建分支： git branch dev创建并切换分支： git checkout -b ziying建本地分支追踪服务器分支：git branch --set-upstream-to=origin/ziying ziying拉取线上更新代码到本地git更新合并代码流程, 1.如果已commit则需要先reset commit 查看log git b...

2020-10-27 14:03:29 952

原创 git工具使用代码管理

Git：本地分支和远程分支建立追踪关系git branch --set-upstream-to=<远程主机名>/<远程分支名> <本地分支名>git branch --set-upstream-to=origin/ziying ziying在多人协同开发中，A在本地开发完成后，将代码推送到远程，这时候B的本地代码的版本就低于远程代码的版本，这时候B该如何从远程拉取最新的代码，并与自己的本地代码合并?1. 查看远程仓库列表git re...

2020-10-27 13:32:14 168

原创 Ubuntu16.04环境 git安装与配置

Ubuntu16.04环境下git安装与配置1.Git安装sudo apt-get install git2.配置git环境git config --global user.name "用户名"git config --global user.email "邮箱"3.生成SSH密钥，输入下面命令后直接回车ssh-keygen -t rsa -C "用户名/邮箱" 公钥的存放位置 ~/.ssh/id_rsa.pub4. 登录GitHub填入client端生成..

2020-10-27 12:37:32 316

原创 python GIL(全局解释器锁)

1. 单线程死循环在VMware虚拟软件中将Ubuntu设置为单核cpu# 主线程死循环，占满cpuwhile True: pass2. 多线程死循环在VMware虚拟软件中将Ubuntu设置为双核cpuimport threading#子线程死循环def test(): while True: passt1 = threading.Thread(t...

2018-04-02 12:56:21 1303

zi_ying123的博客