- 博客(10)
- 资源 (1)
- 收藏
- 关注
转载 正则表达式中文和中文符号
匹配中文标点符号: [\u3002\uff1b\uff0c\uff1a\u201c\u201d\uff08\uff09\u3001\uff1f\u300a\u300b]匹配中文字符的正则表达式: [\u4e00-\u9fa5]\uff0c:中文逗号https://blog.youkuaiyun.com/weixin_44521703/article/details/100187377...
2020-03-20 15:12:55
4326
原创 xpath语法
xpath学习重点1 获取文本 -'a/text()' 获取a下的文本 -'a//text()' 获取a下的所有标签文本 -'//a[text()='下一页']' 选择文本为下一页三个字的a标签2 @符号 -'a/@href' 获取属性 -'//ul[@id="detail-list"]' 元素定位3 '//' -在xpath开始的时候表示从当前ht...
2020-03-13 09:08:48
202
原创 爬虫-requests请求网页总结
相关基本常识解释User_Agent:浏览器名称,修改版本以及版本号可爬取手机页面cookie:保存浏览器本地用户信息(容量有限)session:保存在对方服务器上,比cookie安全referer:当前页面跳转之前的页面Upgrade-Insecure-Requests:将http升级为https请求协议X-requested-wth:XMLHTTPRequests,是A...
2020-03-12 16:35:21
523
原创 正则表达式
Python中的re模块匹配某个字符串import retext='hello'ret=re.match('he',text)print(ret.group())import retext='hello'ret=re.match('.',text)//'.' 匹配任意一个字符print(ret.group())-->hmatch()函数从第一个元素...
2020-03-12 16:16:02
136
原创 爬虫数据存储方式
Json文件JSON支持数据格式:1 对象(字典),使用{}2 数组(列表),使用[]3 整形、浮点型、布尔类型还有null类型4 字符串类型(字符串必须用双引号(""),不能用单引号(''))import jsonperson=[{'user':'zhangsan','id':01},{'user':'lisi','id'=02}]json_str=json.d...
2020-03-12 16:09:27
286
原创 爬虫-lxml和BeautifulSoup解析网页总结
爬虫的几种解析数据的方法Python中的lxml模块使用示例:from lxml import etreehtmlelement = etree.HTML(html.text)print(etree.tostring(htmlelement,encoding='utf-8').decode('utf-8'))使用etree.parse()解析函数默认是使用xml解析器,遇到不...
2020-03-12 12:07:29
1101
转载 关于CSS选择器
关于CSS选择器部分摘自另一博友博文:原文链接:https://blog.youkuaiyun.com/olizxq/article/details/81838212。关于CSS选择器:CSS基本语法 1元素选择器: 直接选择文档元素 比如head,p 2 类选择器: 元素的class属性,比如<h1 class="import...
2020-03-12 12:03:25
149
原创 python利用ibm_db连接DB2数据库报错,且看不到任何报错信息。
pycharm安装ibm_db的方法:1 通过pycharm下的settings下的project interpreter,选对解释器后,点击加号,搜索ibm_db即可安装;(python3.7.3可能找不到此包)2 在有网的情况下,在pycharm的ternimal下pip install ibm_db安装即可;3 通过cmd安装。首先下载ibm_db安装包,https://pypi...
2019-11-07 08:50:27
1469
原创 关于DBvisualizer pro中建表,报错-104
今晚建表时,一直不成功。原因是因为我添加了备注信息,所以一直报-104语法错误。而且sql语句中的备注信息乱码,所以预测是编辑器的编码方式存在问题!!...
2019-10-31 21:04:59
824
原创 关于Python中的类与属性
根据廖雪峰老师的网站,学习过后的笔记问题:请把下面的Student对象的gender字段对外隐藏起来,用get_gender()和set_gender()代替,并检查参数有效性:...
2019-09-29 18:54:05
229
notebook.pdf
2019-11-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人