
Python
Armruo_Zou
这个作者很懒,什么都没留下…
展开
-
python爬虫示例 | 爬取etherscan上的ERC20代币详情,清洗后写入mysql
最近需要对已收录的代币,对其合约地址查找出代币详情,并更新进数据库。爬取etherscan大陆官网实现如下import reimport requestsfrom bs4 import BeautifulSoupimport pymysqlfrom utils import utilsclass getTokensDetailFromEs(): # 存储列表到详情的url html_list_link = [] def __init__(self):原创 2020-08-06 17:49:49 · 2902 阅读 · 5 评论 -
使用python将mongoDB中的数据写入MySQL中
记录一次尝试:首先导入模块:import pymysqlimport pymongofrom utils import utilsfrom pymongo import MongoClientfrom web3 import Web3, HTTPProviderfrom bson import objectid # 用在mongoDB的find_one()方法上,否则会报错执行以下代码(部分信息略去):class DailyStatisticSum: def __init__原创 2020-07-04 16:56:08 · 765 阅读 · 0 评论 -
python装饰器decorator:定义、语法与使用
装饰器 decorator一、装饰器定义在不改变原有函数代码,且保持原函数调用方法不变的情况下,给原函数增加新的功能(或者给类增加属性和方法)核心思想:用一个函数(或者类)去装饰一个旧函数(或者类),造出一个新函数(或者新类)应用场景:引入日志,函数执行时间的统计,执行函数前的准备工作,执行函数后的处理工作,权限校验,缓存等语法规则:在原有的函数上加上 @符,装饰器会把下面的函数当作参数传递到装饰器中,@符又被成为 语法糖1.装饰器原型(闭包)# 1。 装饰器的原型### 利用闭包,把函数当原创 2020-07-04 16:53:42 · 268 阅读 · 0 评论 -
python之pickle序列化与json序列化模块 | dumps、loads、dump、load
一、序列化模块**序列化:**指把python中的数据以文本或二进制的方式进行转换,并且还能反序列化为原来的数据(转成二进制)**为什么需要对数据进行序列化:**数据在程序与网络中进行传输和存储时,需要以更加方便的形式进行操作主要方法:①二进制序列化模块 pickle (python专用)②文本序列化模块 json (互联网通用)与 json 模块的比较:Pickle 协议和 JSON (JavaScript Object Notation) 间有着本质的不同:JS原创 2020-07-04 16:50:27 · 511 阅读 · 0 评论 -
python数据挖掘 | 基本概念与KNN
一、机器学习与数据建模学习: 通过接收到的数据,归纳提取相同与不同。机器学习: 让计算机以数据为基础,进行归纳与总结模型: 数据解释现象的系统。不管是学习还是机器学习,都是一个过程,经过这个过程我们会得到一个针对数据的反应机制和客体,即一个根据已有数据特点和关系对新接收的数据进行解释与输出的系统,这个系统就是我们提到的模型。模型从实质上来讲,是一个对于数据的函数,这个函数的映射方式,是由大量数据的共性和相应性决定的,所以模型是被数据直接决定的。可以简单地认为机器学习是个过程,而模型是原创 2020-06-08 01:07:09 · 258 阅读 · 0 评论 -
详解Python中的File(文件)操作
目录Python中的File(文件)操作写入文件的操作:读取文件的操作:一、文件操作相关函数1. open() 打开文件2. seek() 设置文件指针的位置3. write() 写入内容4. writelines() 写入容器类型数据5. read() 读取内容6. readline() 读取一行7. readlines() 读取所有行8. close() 关闭文件9.truncate() 截断文件内容二、文件操作的高级便捷写法三、文件的路径:四、打开的模式:1. 基础模式: w r x a2.原创 2020-06-06 03:52:19 · 6163 阅读 · 0 评论 -
Python实践 | 使用数据写入文件的方式完成注册和登录功能
一、题目要求:注册功能需要用户名和密码以及确认密码注册时如果用户名已经存在,则不能再次注册登录功能需要使用已经注册的用户信息登录密码输入错误3次后,锁定账户信息(不能再使用这个账户进行登录操作)二、代码实现1.注册功能# 3.专门定义数据变量,存放已经注册的用户信息userlist = [] # 存放所有的用户名pwdlist = [] # 存放所有的用户密码# 2.读取所有的注册信息 使用a+模式打开文件,在调整指针位置,防止文件不存在时报错with open('./u原创 2020-06-06 03:39:53 · 2662 阅读 · 1 评论 -
Python数据挖掘 | 多因子与复合分析(上)
目录多因子与复合分析一、理论铺垫1.假设检验与方差检验2.相关系数:皮尔逊、斯皮尔曼3.回归:线性回归4.主成分分析(PCA)与奇异值分解二、 属性间的复合分析1.交叉分析2.分组与钻取本文由Armruo_Zou首发于优快云,未经授权不得转载,转载请与我联系并注明出处。多因子与复合分析一、理论铺垫1.假设检验与方差检验假设检验:**(1)概念:**根据一定的假设条件,从样本推断总体or推断样本与样本之间的关系的方法。即做出一个假设,然后根据数据或已知的分布性质来推断这个假设成立的概率有多大原创 2020-06-02 12:08:54 · 1234 阅读 · 0 评论 -
Python数据挖掘 | 单因子探索分析与数据可视化
本文由Armruo_Zou首发于优快云,未经授权不得转载,转载请与我练习并注明出处。一、理论铺垫1.集中趋势(数据聚拢位置的一种衡量)(1)均值mean: 常用于衡量连续值,尤其是数据分布比较规律均匀的连续值的集中趋势(2)中位数median: 适合衡量有异常值(比如一些数特别大/小)(3)众数mode: 主要用于离散值的集中衡量(4)分位数quantile: 就是把数据从小到大排列,然后分成等份的数据点,最常用的是4分位数(q=0.25)。和其他几个数共同作用会产生不错的效果四分位数的原创 2020-05-25 18:17:42 · 811 阅读 · 0 评论 -
Python笔记 | Python中各种下划线的作用;单引号、双引号、三引号的区别。
一、下划线一个前导下划线:表示非公有,也叫做保护变量,表示类对象和子类对象自己才能访问这些变量。采用 from somemodulename import * 的方法导入模块时,被保护的变量不会被导入。在这里插入代码片一个后缀下划线:为了避免关键字冲突,采用的一种命名方法。两个前导下划线:私有属性,当命名一个类属性可能引起名称冲突时使用。避免与子类中的属性命名冲突,无法在外部直接访问(...原创 2020-05-25 17:46:06 · 527 阅读 · 0 评论