python
洛樱冰飞
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据清洗
1. to_datatime 转化成时间类型 转换成时间类型,要通过format 指定之前的格式 转换后可以看到Boarding_time 变成 datatime64类型 2. astype 转化成其他类型,如这里转化成浮点型 3. duplicated 查看重复值 drop_duplicates 去重, inplace = True 表示更改数据源data 4. 空值 isnull 判断哪个位置为空,用any判断哪列有空值 dropna 删除空值 fi..原创 2020-08-23 21:31:32 · 240 阅读 · 0 评论 -
pandas 读取数据库数据
调用pymysql 的connect 方法 host: mysql 服务器 user:数据库的用户名 password:数据库的密码 port: 端口号 charset:数据库的字符集 1. shape 表示sql结果有几行几列 columns 表示数据库中表的定义值 可用索引调用单个或多个列 ...原创 2020-08-23 17:47:50 · 648 阅读 · 0 评论 -
Numpy
连续索引:取出前三个元素 间断索引:取出第一第四第六个元素 逻辑索引:取出小于19的数 构造二位数组: 取某个位置的值: 取某一行的值: 取某一列的值原创 2020-08-19 22:34:11 · 147 阅读 · 0 评论 -
ProxyHandler
ProxyHandler 处理器(代理设置):解决封ip问题 返回值中可以看到是指定的ip原创 2020-07-20 21:51:11 · 1266 阅读 · 0 评论 -
urllib parse 库
parse.urlencode: 字典转化成url 编码 结果: name=%E5%B4%94%E5%86%B0%E6%B4%81&age=18&greet=hello+world parse_qs: 将经过编码的url进行解码 结果:{'name': ['崔冰洁'], 'age': ['18'], 'greet': ['hello world']} urlparse 和 urlsplit: 解析url 区别:urlparse 有params ...原创 2020-07-18 23:24:21 · 175 阅读 · 0 评论 -
分布式进程
分布式进程指的是将Process进程分布的多台机器上,充分利用多台机器的性能完成复杂的任务,我们可以将这点应用的分布式爬虫的开发中。 我们举个简单例子,服务进程用来设置任务在task_queue,并设置接口。任务进程调用相同的接口,执行任务,结果写进result queue taskManager.py : 服务进程 from multiprocessing.managers import BaseManager from multiprocessing import freeze...原创 2020-06-21 21:39:44 · 521 阅读 · 0 评论
分享