
pyhon爬虫
一支海棠
这个作者很懒,什么都没留下…
展开
-
Python爬虫记录 爬虫豆瓣电影Top 250
Python存储99乘法表到exl中# -*- coding: utf-8 -*-import xlwt'''wookbook = xlwt.Workbook(encoding="utf-8") #创建workbook对象worksheet = wookbook.add_sheet('sheet1') #创建工作表worksheet.write(0,0,'hello') # 行 列 内容wookbook.save('student.xls') #保存数据表'''wookbo原创 2020-12-01 13:13:25 · 430 阅读 · 1 评论 -
用python正则表达式提取字符串
在日常工作中经常遇见在文本中提取特定位置字符串的需求.python的正则性能好,很适合做这类字符串的提取,这里讲一下提取的技巧,正则表达式的基础知识就不说了,有兴趣的可以看re的教程. 提取一般分两种情况,一种是提取在文本中提取单个位置的字符串,另一种是提取连续多个位置的字符串.日志分析会遇到这种情况.下面我会分别讲一下对应的方法:1. 单个位置的字符串提取这种情况我们可以使用(.+?)这个正则表达式来提取. 举例,一个字符串"a123b",如果我们想提取ab之间的值123,可以使用findall配合正转载 2020-12-01 11:38:32 · 1618 阅读 · 0 评论 -
Python 爬虫笔记
Python 爬虫Pycharm引入包HTTP Error 418错误关于代理服务器的方法获取User-Agent随机获取User-Agent引入fake-useragent包Pycharm引入包但是可能会出现下载过慢 或者和我一样根本搜索不到的问题那就进行换源建议多加几个,因为也很容易下载失败,添加完了以后,可以重启一下pycharm,再次利用pycharm下载,搜索包的时候要看包所对应的换源之后的地址http://mirrors.aliyun.com/pypi/simple/http原创 2020-11-30 17:11:02 · 316 阅读 · 1 评论