
python
Mr Robot
When I’m old and dying, I plan to look back on my life and say “wow, that was an adventure,” not “wow, I sure felt safe.”
山东南海岸程序猿,美国《时代周刊》2006年度风云人物;
《感动中国》2008年度人物;
联合国2019年度“地球卫士奖”
国际奥委会2022年”奥林匹克奖杯“获奖者
展开
-
Python科学计算库制图
Pandas制图Pandas之Series 制图Pandas之DataFrame制图Pandas综合应用1导入ca_list_copy.csv文件到DataFrame中,实现以下操作:对异常数据(数值为0)进行值替换,替换为当前列的平均值;对zwyx列的数据进行平均值统计,其他列做计数统计(提示使用value_counts());得到zwmc字段的唯一值列表;通过group函数,实现对于dd字段的分组,并按照城市计算每个城市的最大薪资,使用折线图,显示Top10城市。Pan原创 2021-09-07 09:00:42 · 185 阅读 · 0 评论 -
Python科学计算库Pandas聚合之apply
apply 是 pandas 库的一个很重要的函数,多和 groupby 函数一起用,也可以直接用于 DataFrame 和 Series 对象。主要用于数据聚合运算,可以很方便的对分组进行现有的运算和自定义的运算。Pandas聚合之applyPandas聚合之apply练习1时间数据提取,数据如左下图所示,包含数值部分以及时间部分。要求:提取数据时间部分,返回对应的每行数据的年、月、日三列数据。效果如右下图所示。Pandas聚合之apply练习2请结合apply与groupy函数完原创 2021-09-07 08:56:30 · 530 阅读 · 0 评论 -
Python科学计算库Pandas分组
groupby 对DataFrame进行数据分组,传入列名列表或者Series序列对象,返回生成一个GroupBy对象。它实际上还没有进行任何计算。GroupBy对象是一个迭代对象,每次迭代结果是一个元组。元组的第一个元素是该组的名称(就是groupby的列的元素名称)。第二个元素是该组的具体信息,是一个数据框。索引是以前的数据框的总索引。Pandas分组之聚合操作...原创 2021-09-07 08:52:50 · 114 阅读 · 0 评论 -
Python科学计算库Pandas数据统计
用于计算一个Series中各值出现的频率。原创 2021-09-07 08:50:49 · 154 阅读 · 0 评论 -
Python科学计算库Pandas排序sort
Pandas排序之sort_indexsort_index 对行或列索引进行排序。Series 的 sort_index(ascending=True) 方法可以对 index 进行排序操作,ascending 参数用于控制升序或降序,默认为升序。在 DataFrame 上,.sort_index(axis=0, by=None, ascending=True) 方法多了一个轴向的选择参数与一个 by 参数,by 参数的作用是针对某一(些)列进行排序(但是不能对行使用 by 参数)Pandas排序原创 2021-09-07 08:49:40 · 502 阅读 · 0 评论 -
Python科学计算库之matplotlib常见图形
Matplotlib柱状图练习:用柱状图表示第一季度的进出口数据进口数据:1月份 600亿美元2月份 700亿美元3月份 800亿美元出口数据:1月份 500亿美元2月份 900亿美元3月份 1000亿美元matplotlib.pyplot.hist(x,bins=10,range=None,normed=False,weights=None,cumulative=False,bottom=None,histtype='bar', align='mid',orientation=原创 2021-09-07 08:44:35 · 168 阅读 · 0 评论 -
Python科学计算库之Matplotlib
Python最常用的绘图库,提供了一整套十分适合交互式绘图的命令API,比较方便的就可以将其嵌入到GUI应用程序中。官网:http://matplotlib.org/学习方式:从官网examples入门学习http://matplotlib.org/examples/index.htmlhttp://matplotlib.org/gallery.html为什么选择Matplotlib1.Matplotlib 是一个非常强大的 Python 画图工具.2.手中有很多数据, 可是不知道该怎么呈现原创 2021-09-07 08:38:58 · 802 阅读 · 0 评论 -
Python科学计算库之pandas基本功能
数据文件读取/文本数据读取与文本存储索引、选取和数据过滤算法运算和数据对齐函数的应用和映射层次索引排序分组聚合pandas:数据文件读取通过pandas提供的read_xxx相关的函数可以读取文件中的数据,并形成DataFrame,常用的数据读取方法为:read_csv,主要可以读取文本类型的数据通过DataFrame的相关方式可以获取对应的列或者数据形成一个新的DataFrame, 方便后续进行统计计算。pandas:缺省值NaN处理方法对于DataFrame/Series原创 2021-09-07 08:29:54 · 1737 阅读 · 0 评论 -
Python科学计算库之pandas
pandas是一种Python数据分析的利器,是一个开源的数据分析包,最初是应用于金融数据分析工具而开发出来的,因此pandas为时间序列分析提供了很好的支持。pandas是PyData项目的一部分。官网:http://pandas.pydata.org/官方文档:http://pandas.pydata.org/pandas-docs/stable/安装过程详见: 官方安装文档Python版本要求:2.7、3.4、3.5、3.6依赖Python库:setuptools、NumPy、python原创 2021-09-06 14:47:48 · 560 阅读 · 0 评论 -
Python科学计算库之NumPy基本操作
NumPy基本操作数组与标量、数组之间的运算数组的矩阵积(matrix product)数组的索引与切片数组的转置与轴对换通用函数:快速的元素级数组成函数聚合函数np.where函数np.unique函数ndarray-数组与标量、数组之间的运算数组不用循环即可对每个元素执行批量的算术运算操作,这个过程叫做矢量化,即用数组表达式代替循环的做法。矢量化数组运算性能比纯Python方式快上一两个数据级。大小相等的两个数组之间的任何算术运算都会将其运算应用到元素级上的操作。**元素级操作原创 2021-09-06 14:36:15 · 293 阅读 · 0 评论 -
Python科学计算库之 numpy 模块
Scipy库简介Scipy库是基于Python生态的一款开源数值计算、科学与工程应用的开源软件,主要包括NumPy、Scipy、pandas、matplotlib等等。官方文档:https://scipy.org/numPy、Scipy、pandas、matplotlib简介numpy——基础,以矩阵为基础的数学计算模块,纯数学存储和处理大型矩阵。 这个是很基础的扩展,其余的扩展都是以此为基础。scipy——数值计算库,在numPy库的基础上增加了众多的数学、科学以及工程计算中常用的库函数。原创 2021-09-06 09:19:14 · 847 阅读 · 0 评论 -
Python科学计算库之numpy模块
Jupyter Notebook1.打开cmd,输入 jupyter notebook --generate-config2.打开这个配置文件,找到“c.NotebookApp.notebook_dir=‘’ ”,把路径改成自己的工作目录3.配置文件修改完成后, 以后在jupyter notebook中写的代码等都会保存在自己创建的目录中。*设置jupyter密码:from notebook.auth import passwdpasswd()保存生成的秘钥至配置文件的“c.Noteboo原创 2021-09-04 17:43:46 · 135 阅读 · 0 评论 -
Python科学计算库之time模块
time模块常用的一种获取当前时间以及时间格式化的模块,模块名称:timetime模块在Python原生安装中就存在所以不需要进行任何安装操作,直接使用即可。导入方式: import timetime模块-常用方法time模块-时间元组1.将字符串的时间"2017-10-10 23:40:00"转换为时间戳和时间元组2.字符串格式更改。如提time = “2017-10-10 23:40:00”,想改为 time= “2017/10/10 23:40:00”3.获取当前时间戳转换为指定格原创 2021-09-04 16:14:40 · 396 阅读 · 0 评论