
Python
番茄大人
月更出奇迹
展开
-
数据结构与算法(python):散列 Hash与区块链技术
参考自 MOOC数据结构与算法Python版目录一、什么是散列基本概念二、完美散列函数2.1 散列函数MD5/SHA2.2 Python的散列函数库hashlib2.3 完美散列函数用于数据一致性校验三、散列函数的最酷应用:区块链技术3.1 区块链的组成3.2 为什么有效散列值那么难计算3.3 为什么矿工抢着生成区块?3.4 区块链技术飞速扩张的应用四、散列函数设计4.1 折叠法4.2 平方取中法4.3 对非数项进行散列一、什么是散列如果我们事先能知道要找的数据项应该出现在数据集中的什么位置, 就可以原创 2020-09-21 23:22:02 · 475 阅读 · 1 评论 -
python:数据分析与处理(pandas库)
pandas官方网站目录Pandas入门Series 类型Series 的创建标量值创建字典创建ndarray创建Series的基本操作Series类型包括index和values两部分Series类型类似ndarray类型Series类型的操作类似Python字典类型Series类型对齐操作Series类型的name属性Series类型的修改DataFrame类型DataFrame的创建从二维...原创 2020-04-20 01:24:14 · 496 阅读 · 0 评论 -
python: 数据分析与表示(Numpy库)
列表和数组的区别列表:数据类型可以不同数组:数据类型相同Numpy的引用(使用约定的别名np)import numpy as npN维数组对象 ndarray例:计算A2+B3A^2+B^3A2+B3,其中AAA和BBB是一维数组import numpy as npdef npSum():a = np.array([0,1,2,3,4])b = np.array([9,8,7...原创 2020-04-12 11:22:57 · 306 阅读 · 0 评论 -
python:文件读取和存储
文章目录一、文件的打开、读取、加载1、python内置函数:open()打开、f.read()读取2、pandas库3、numpy库二、文件的写入、存储1、python内置函数:f.write()、f.writelines()2、np.savetxt():3、to_csv():打开文件读文件/写文件关闭文件(防止程序异常奔溃)一、文件的打开、读取、加载1、python内置函数:open(...原创 2020-03-20 19:36:42 · 10148 阅读 · 0 评论 -
python:抽象
面向对象:对象(实例)– 由数据及能对其实施的操作所构成的封装体(例如猫亚科动物中的美短、英短、苏格兰折耳猫、波斯猫、暹罗猫、布偶猫等)类– 类描述了对象的特征,一个模板(例如猫亚科动物,都有特征:三角耳,圆眼睛,擅长爬树,喜欢鱼)面向对象之抽象:对话框可作为一个类,具体每个对象之间:相同点:– 有名字– 有矩形框– 鼠标点击时有效果不同点– 功能不同:刷新、退出...原创 2020-03-08 12:37:21 · 154 阅读 · 0 评论 -
python:数据预处理之数据规约
目的: 对属性和数值进行规约获得一个比原始数据集小的多的规约表示,但仍接近原数据的完整性,在规约后数据集上挖掘可产生近乎相同的分析结果。简单来说,通过降维或维数规约来缓解维数灾难(在高维数据中可能会让样本稀疏,即样本中出现大量的0,以及距离计算困难等等)常用方法:属性规约:向前选择,向后删除,决策树,PCA数值规约:有参方法(回归法、对数线性模型),无参法(直方图、聚类、抽样)一、属性...原创 2020-03-07 13:59:33 · 2527 阅读 · 0 评论 -
python:数据预处理之数据变换
数据变换就是把数据变为合适的形式,常见的方式有:规范化连续属性离散化特征二值化1. 数据规范化解决哪些影响?量纲不同数值范围差异大规范化的常用方法:最大-最小规范化z-score规范化小数定标规范化1.1 最大-最小规范化适合不涉及距离的度量场景,公式如下:x′=x−minmax−min{x}'=\frac{x-min}{max-min}x′=max−min...原创 2020-03-07 12:32:25 · 590 阅读 · 0 评论 -
python:数据预处理之数据清洗
数据预处理包含数据清洗 Data cleaning数据集成 Data integration数据变换 Data transformation数据规约 Data reduction一、 数据清洗数据清洗包括缺失值处理、1. 缺失值处理删除填充– 固定值– 均值,中位数/众数– 上下数据– 插值函数– 最可能的值DataFrame处理缺失值数据选自私家车轨迹数据...原创 2020-03-05 18:00:06 · 717 阅读 · 0 评论 -
python: 绘图基础
matplot绘图折线图import matplotlib.pyplot as pltplt.plot([2,3,1,5,3,1]) #默认参数是Y轴plt.show()plt.savefig('zhexian.png')#保存图片多组数据绘图:import matplotlib.pyplot as pltimport numpy as npt = np.arange(0.,...原创 2020-03-04 21:07:25 · 411 阅读 · 0 评论 -
python:时间序列
Series基本特征– 类似有序定长的字典,类似一维数组的对象– 由数据和索引组成import pandas as pd#创建方式aSer = pd.Series([1,2.0,'a'])#自带索引0:1 1:2.0 2:abSer = pd.Series(['Bieber','Billie','Beyonce'],index = [a,b,c])#自定义索引#访问数据p...原创 2020-03-04 13:26:08 · 206 阅读 · 0 评论 -
python:ndarray的基本用法
ndarray数组属性– 维度(dimensions)称为轴(axis), 轴的个数成为秩(rank)axis = 0, 对列操作axis = 1, 对行操作– 基本属性ndarray.ndim(秩)ndarray.shape(维度)ndarray.size(元素总个数)ndarray.dtype(元素类型)ndarray.itemsize(元素字节大小)ndarray的创...原创 2020-03-03 14:05:01 · 11787 阅读 · 0 评论 -
python:字典
字典是一种映射类型,包括键(key),必须是不可变类型,不可用list值(value),无序存储,sorted(dict)返回的是内部存储顺序key - value 对创建字典的方式直接创建d = {key1:value1,key2:value2}利用dict函数d = [(key1,value1),(key2,value2)]d_ = dict (d)#或者d...原创 2020-03-02 18:56:05 · 392 阅读 · 0 评论 -
python:可变可迭代对象修改问题
在python中,可变对象在迭代时会发生错乱,如:lst = [1, 2, 3, 4, 5]for x in lst: if x%2==0: lst.remove(x) #remove,insert等操作print(lst)output:[1, 4, 3, 5]解决办法是创建一个lst的浅拷贝lst[:]lst = [1, 2, 3, 4, 5]for x in lst[:...原创 2020-03-02 17:23:38 · 913 阅读 · 1 评论 -
零零碎碎的Python问题
1. contourf 画图出现白色无效区域 代码如下 cs=ax.contourf(x , y, z, levels, cmap=cmap)【解决办法】z是图像呈现的重点数据,中间出现负值所以留白,所以将负值改为0z[z< 0] = 0 cs=ax.contourf(x , y, z, levels, cmap=cmap)...原创 2019-12-28 20:14:34 · 476 阅读 · 0 评论