
python
Leslie_Waong
这个作者很懒,什么都没留下…
展开
-
Python学习之用Requests和XPath多进程爬取有道单词数据
基础知识爬虫基本原理1、发起请求使用http库向目标站点发起请求,即发送一个RequestRequest中包含哪些内容?(1)请求方式主要是GET、POST两种类型,另外还有HEAD、PUT、DELETE、OPTIONS等。(2)请求URLURL全称是统一资源定位符,如一个网页文档、一张图片、一个视频等都可以用URL来唯一来确定(3)请求头包含请求时的头部信息,如User-...原创 2020-07-10 12:42:21 · 596 阅读 · 0 评论 -
Python学习之BeautifulSoup和XPath爬取英语文章和音频
和 lxml 一样,Beautiful Soup 也是一个HTML/XML的解析器,主要的功能也是如何解析和提取 HTML/XML 数据。lxml 只会局部遍历,而Beautiful Soup 是基于HTML DOM(Document Object Model)的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,所以性能要低于lxml。BeautifulSoup 用来解析 HT...原创 2020-07-10 12:41:58 · 1097 阅读 · 0 评论 -
Python学习之字符串相关
ord()与chr()用法以及区别ord()函数主要用来返回对应字符的ASCII码。chr()主要用来表示ASCII码对应的字符他的输入时数字,可以用十进制,也可以用十六进制。#以上程序主要实现对字符串str1里面所有的字符,转换成ASCII码中比他们小一位的字符。str1='asdfasdf123123'for i in range(len(str1)): print( c...原创 2020-04-17 23:00:16 · 300 阅读 · 0 评论 -
Python学习之文件处理
打开关闭open(),close()with语句 with open("./2/"+str(i)+".txt", 'r',encoding="utf-8") as f: lines = f.readlines()参数值描述‘r’读取模式(默认值)‘w’写入模式,当文件不存在时创建它,当文件存在时清除原有内容‘x’独占写入模式...原创 2020-04-17 16:24:12 · 347 阅读 · 0 评论 -
Python学习之VS Code
下载Visual Studio CodePython安装插件json暂无深究,简单了解创建或打开文件夹后settings.json中有python的安装地址launch.json可自己加上"cwd": “${fileDirname}”Vscode的相对路径读取问题及处理vscode相对路径:相对于工作路径(.vscode文件夹所在的位置)可能出现的异常:发生异常: ...原创 2020-04-17 15:55:57 · 409 阅读 · 0 评论