
Python模块
Python之简
人一定要逼自己一把
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
requests 不能发送 bytearray 数据
requests 不能发送 bytearray 数据import requestsbody = b"abc"body = bytearray(body)r = requests.post('https://example.com', data=body)# r = requests.post('https://example.com', data=memoryview(body))pr...原创 2019-10-21 20:43:09 · 1984 阅读 · 0 评论 -
Xpath常用语法
Xpath常用语法Xpath 是一门在XML文档中查找信息的语言。Xpath 用来在XML文档中对元素和属性进行遍历。Xpath工具推荐chrome 插件 XPath Helper快捷键:CTRL+SHIFT+X :开启长按 CTRL+SHIFT+鼠标:提取段落Xpath语法常用路径表达式表达式描述/从根节点选取nodename选取节点的所...原创 2019-01-05 18:14:15 · 1796 阅读 · 0 评论 -
Python的functools模块
Python的functools模块functools 模块可以说主要是为函数式编程而设计,用于增强函数功能。functools模块用以为可调用对象(callable objects)定义高阶函数或操作。文章目录Python的functools模块partialupdate_wrapperwrapsreducecmp_to_keylru_cachesingledispatchparti...原创 2018-12-09 19:22:17 · 29762 阅读 · 0 评论 -
Python的Collections
文章目录defaultdict在字典中对键进行嵌套操作counterdequenametupledefaultdict不需要检查key是否存在from collections import defaultdictdemo = (('a',1),('b',2),('c',3),('d',4))print(dict(demo))default_demo = defaultdict(...原创 2018-12-07 16:31:42 · 733 阅读 · 0 评论 -
Faker模块
Faker模块该模块主要是用来伪造一些看起来一点都不假的数据。一开始看到该模块我就想到了李相赫,有道词典翻译这个词竟然显示出来了李相赫。。哈哈哈哈。。安装pip install faker创建Fakerfrom faker import Faker, Factoryfake = Faker("zh_CN") # 默认英文,初始化为中文print(fake.name())...原创 2018-11-19 17:21:52 · 3302 阅读 · 0 评论 -
Whoosh模块
Whoosh模块纯Python的全文搜索库,Whoosh是索引文本及搜索文本的类和函数库。它能让你开发出一个个性化的经典搜索引擎。Whoosh 自带的是英文分词,对中文分词支持不太好,使用 jieba 替换 whoosh 的分词组件。索引查找索引查找是在索引表和主表(线性表的索引存储结构)上进行查找。索引查找的过程:根据给定的索引值k1,在索引表上查找出索引值等于k1的索引项,...原创 2018-11-15 15:17:14 · 10019 阅读 · 0 评论 -
Reuqests-html教程
文章目录Reuqests-html安装基本使用获取页面非异步异步获取获取链接获取元素CSS选择器Xpath选择器元素内容JavaScript支持render函数属性异步请求不带请求Reuqests-htmlrequests 作者开发,集成 pyppeteer。最近爬虫遇到的情况是,爬取的网站使用JavaScript渲染的,网站爬取的结果只有一堆JS代码。之前遇到这种情况的处理办法是用Sp...原创 2018-10-26 13:53:54 · 2436 阅读 · 2 评论 -
Python中常用re模块
Python中常用re模块常用语法: ^ 匹配字符串开头 $ 匹配字符串结尾 . 匹配任意字符,除了换行符 […] 匹配指定的一组字符,[amk]匹配’a’或’m’或’k’ [^…] 匹配除了这组字符以外的字符 * 匹配0或多个 + 匹配1或多个 ? 匹配0或1个,非贪婪模式 {n...原创 2018-07-10 00:07:44 · 1943 阅读 · 0 评论 -
Python中的多线程
Python中的多线程在Python中,你可以启动一个线程,但却无法停止它。 内容:threading模块,和queue模块的结合使用及实践。一、简介:多线程对于具有以下特点的编程任务是非常理想的:本质上是异步的;需要多个并发活动;每个活动的处理顺序可能是不确定的,或者说是随机的、不可预测的。这种编程任务可以被组织或划分成多个执行流,其中每个执行流都有一个指定要完成的任务。...原创 2018-07-08 00:58:44 · 294 阅读 · 0 评论 -
Python队列Queue
Python队列QueueQueue是python标准库中的线程安全的队列(FIFO),提供了一个多线程的先进先出的数据结构,即队列,用来在生产者和消费者线程之间的信息传递。常见方法1、put(item[,block[,timeout]]) 将item放入队列中: 1. block为True且timeout为空对象(默认的情况下,阻塞调用,无超时)。 2. timeout为正...原创 2018-07-03 00:49:35 · 453 阅读 · 0 评论 -
python中os模块
python中os模块Python os模块包含普遍的操作系统功能。如果你希望你的程序能够与平台无关的话,这个模块是尤为重要的。常用方法1、os.name输出字符串指示正在使用的平台。如果是window 则用’nt’表示,对于Linux/Unix用户,它是’posix’2、os.getcwd()得到当前的工作目录3、os.listdir()得到指...原创 2018-07-01 16:02:11 · 270 阅读 · 0 评论 -
Python使用Beautiful Soup
Python使用Beautiful Soup**介绍:**Beautiful Soup是Python的一个HTML或XML的解析库,可以用来方便的从网友中提取数据。 **编码问题:**Beautiful Soup自动将输入文档转换为Unicode编码,输出文档转换为UTF-8编码。 **依赖问题:**Beautiful Soup实际上依赖解析器,除了Python标准库中的HTML解析器外,...原创 2018-06-29 17:02:13 · 376 阅读 · 1 评论 -
Python中time和datetime模块
Python中time和datetime模块1、time模块time模块时间的格式有三种: 1. timestamp:时间戳,格林时间1970年1月1日开始秒的偏移量。 2. struct_time:时间元组,共9个元素 3. format_time:格式化时间,具有可读性,包括自定义格式和固定格式1、时间格式转换规则2、主要time方法和time格式转换...原创 2018-07-01 02:37:32 · 663 阅读 · 0 评论