- 博客(15)
- 收藏
- 关注
原创 Numpy数据存取
Numpy数据存取numpy提供了便捷的内部文件存取,将数据存为np专用的npy(二进制格式)或npz(压缩打包格式)格式 npy格式以二进制存储数据的,在二进制文件第一行以文本形式保存了数据的元信息(维度,数据类型),可以用二进制工具查看查看内容 npz文件以压缩打包文件存储,可以用压缩软件解压import numpy as npa = np.array([['张三','李四','王五','赵六'],['11','12','13','14','15']])b = a = np.arang
2021-04-10 11:13:53
1157
原创 Pandas分类,&绘图, &时间序列
Pandas分类categorical data是指分类数据:数据类型为:男女、班级(一班、二班)、省份, 使用赋值法给变量赋值,例如(男=1,女=0),数字1, 0之间没有大小之分,不能认为1是比0大的 numerical data是指数值型数据:收入(1000元,500元),是可以进行比较大小并进行运算的数据。从0.15版本开始,pandas可以在DataFrame中支持Categorical类型的数据,Pandas可以在DataFrame中包含分类数据df = pd.DataF..
2021-04-10 11:11:53
1307
1
原创 pandas数据操作,& 数据排序, & 数据类型运算
字符串方法Series对象在其str属性中配备了一组字符串处理方法,可以很容易的应用到数组中的每个元素t = pd.Series(['a_b_c_d','c_d_e',np.nan,'f_g_h'])tt.str.cat(['A','B','C','D'],sep=',') #拼接字符串t.str.split('_') #切分字符串t.str.get(0) #获取指定位置的字符串t.str.replace("_", ".") #替换字符串t.str.pad(10, fillc
2021-04-10 11:00:00
315
原创 Pandas统计分析, 数据存取
pandas数据的基本统计分析和numpy的函数近似dates = pd.date_range('20130101',periods=10)datesdf = pd.DataFrame(np.random.randn(10,4),index=dates,columns=['A','B','C','D'])dfdf.describe() #快速统计结果df.mean() # 按列求平均值df.mean(1) # 按行求平均值基本统计分析函数.describe()针对0轴(列.
2021-04-10 10:52:57
291
1
原创 Pandas缺失数据处理, 数据规整
Pandas用np.nan代表缺失数据reindex()可以修改索引,会返回一个数据的副本:df1 = df.reindex(index=dates[0:4], columns=['A','B','C','D','E'])df1df1 = df.reindex(index=dates[0:4], columns=['A','B','C','D']+['E'])df1df1 = df.reindex(index=dates[0:4], columns=list(df.columns)..
2021-04-10 10:50:08
103
原创 【sed 命令详解】
sed 行文件编辑工具。因为它编辑文件是以行为单位的。命令格式详解命令格式: sed [参数] '<匹配条件> [动作]' [文件名] 注意: 可以通过 sed --help 查看grep的帮助信息参数详解: 参数为空 表示sed的操作效果,实际上不对文件进行编辑 -i 表示对文件进行编辑 注意:mac版本的bash中使用 -i参数,必须在后面单独加个东西: -i ' '匹配条件: 匹配条件分为两种:数...
2020-11-21 13:57:20
1936
原创 【pandas】DataFrame查增改删
DataFrame查增改删查 Read类list/ndarray数据访问方式dates = pd.date_range('20130101',periods=10)datesdf = pd.DataFrame(np.random.randn(10,4),index=dates,columns=['A','B','C','D'])df#索引df['A']df.Adf['A']['2013-01-01']#先列后行df.A['2013-01-01']df[['A','C']]
2020-11-14 14:27:12
172
原创 【pandas】 数据类型-DataFrame
数据类型-DataFrameDataFrame是由多个Series数据列组成的表格数据类型,每行Series值都增加了一个共用的索引 既有行索引,又有列索引 行索引,表明不同行,横向索引,叫index,0轴,axis=0 列索引,表名不同列,纵向索引,叫columns,1轴,axis=1 DataFrame数据类型可视为:二维 带标签 数组 每列值的类型可以不同 基本操作类似Series,依据行列索引操作 常用于表达二维数据,但也可以表达多维数据(Dataframe嵌套,极少用)D
2020-11-14 14:25:48
435
原创 [pandas] 数据类型-Series
数据类型-SeriesSeries数据类型由一组数据和数据相关的索引组成,键 -> 值 Series数据类型可视为:一维 带标签 数组 Series基本操作类似数组和字典Series数据类型的创建首先载入库import numpy as npimport pandas as pdPython list列表创建Seriesa = pd.Series([1,2,3,4]) #默认索引b = pd.Series([1,2,3,4],index=['a','b','c',.
2020-11-14 14:23:36
299
原创 【Pandas】简单介绍
Pandas(panel data & Data Analysis):Python数据分析库。是基于Numpy的,专用于数据分析的Python第三方库,最适用于处理大型结构化表格数据Pandas最初是对冲基金公司开发出来做金融量化数据分析的Python库 Pandas借鉴了R的数据结构 Pandas基于Numpy搭建,支持Numpy中定义的大部分计算 Pandas提供了大量和其他技术交互的接口(比如IO工具 (CSV, XLSX, HDF5, ...),可视化(封装pyplot)...
2020-11-14 14:21:56
324
原创 python下读取csv文件结果转换list
【Linux】Ubuntu16.04环境下git安装与配置Git:本地分支和远程分支建立追踪git branch --set-upstream-to=orign/<远程分支名> <本地分支名>
2020-11-14 13:06:30
2951
原创 拉取线上更新代码到本地 及 提交本地代码到线上的流程
GIT在实际开发中,可能存在master dev分支,我们需要在dev分支下创建至今的分支进行开发操作创建分支: git branch dev创建并切换分支: git checkout -b ziying建本地分支追踪服务器分支:git branch --set-upstream-to=origin/ziying ziying拉取线上更新代码到本地git更新合并代码流程, 1.如果已commit则需要先reset commit 查看log git b...
2020-10-27 14:03:29
879
原创 git工具使用代码管理
Git:本地分支和远程分支建立追踪关系git branch --set-upstream-to=<远程主机名>/<远程分支名> <本地分支名>git branch --set-upstream-to=origin/ziying ziying在多人协同开发中,A在本地开发完成后,将代码推送到远程,这时候B的本地代码的版本就低于远程代码的版本,这时候B该如何从远程拉取最新的代码,并与自己的本地代码合并?1. 查看远程仓库列表git re...
2020-10-27 13:32:14
115
原创 Ubuntu16.04环境 git安装与配置
Ubuntu16.04环境下git安装与配置1.Git安装sudo apt-get install git2.配置git环境git config --global user.name "用户名"git config --global user.email "邮箱"3.生成SSH密钥,输入下面命令后直接回车ssh-keygen -t rsa -C "用户名/邮箱" 公钥的存放位置 ~/.ssh/id_rsa.pub4. 登录GitHub填入client端生成..
2020-10-27 12:37:32
272
原创 python GIL(全局解释器锁)
1. 单线程死循环在VMware虚拟软件中将Ubuntu设置为单核cpu# 主线程死循环,占满cpuwhile True: pass2. 多线程死循环在VMware虚拟软件中将Ubuntu设置为双核cpuimport threading#子线程死循环def test(): while True: passt1 = threading.Thread(t...
2018-04-02 12:56:21
1279
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人