
Python爬虫爬爬爬
多欢喜
漫漫长路,平凡一生
展开
-
Python爬虫报错:No module named jsonpath
还是在写爬虫代码,我又遇到了新的错误源代码是这样子的好吧,其实这个错误很简单,就是没有安装jsonpath那我们就安装一下就OK了打开cmd,安装jsonpath pip install jsonpath原创 2020-05-23 10:09:42 · 9698 阅读 · 0 评论 -
爬虫出现inconsistent use of tabs and spaces in indentation
同样是写爬虫代码,我又遇到了新的问题这个问题还真的是把我难住了,到底是什么原因哦原来是空格问题错误代码行是这样的context_list=pattern.findall(html.decode('utf-8'))看起来跟其他代码是不是没什么差距?然而我们仔细看一下与其他代码之间的区别看到了不,这行代码前面是点点,而其他行代码前面是横线天呐,这个错误太阴险了!不仔细检查根本看不出来这竟然是空格问题!好嘛,那既然是空格问题我们就改一下呗手动加空格或者删掉前面点点再回车,本以为这是个很简单的原创 2020-05-20 11:00:15 · 253 阅读 · 0 评论 -
Python爬虫出现cannot use a string pattern on a bytes-like object
同样是爬虫代码,这次又遇到了新的问题错误代码在这一行context_list=pattern.findall(html)错误原因大概是这样的吧:html用decode(‘utf-8’)进行解码,由bytes变成string。 py3的urlopen返回的不是string是bytes。所以解码一下就okcontext_list=pattern.findall(html.decode('utf-8'))关注欢喜,一起进步呀~...原创 2020-05-20 10:51:42 · 448 阅读 · 0 评论 -
__init__() takes 0 positional arguments but 1 was given
今天写爬虫的时候,写了一个自定义的类,在写初始化函数def init():出现了以下问题:仔细查阅文档,发现原来Python3中的def__init__()函数与之前相比发生了些许变化,是需要带有一定参数的。1.def init(self):这种形式在__init__方法中,只有一个self,指的是实例的本身,但是在方法的类部,包含两个属性:name、year。它允许定义一个空的结构,当新数据来时,可以直接添加。实例化时,需要实例化之后,再进行赋值。比如:def __init__():原创 2020-05-20 10:46:43 · 1554 阅读 · 0 评论 -
No module named cookielib
cookielib是Python2中的包,现在Python3中已经改变了用法, 将‘import cookielib’改为‘http.cookiejar’,相应的在使用方法里cookielib也改成 http.cookiejar原创 2020-05-17 22:50:24 · 1767 阅读 · 0 评论 -
Sublime text 控制台可交互式输入问题
Sublime Text是一个轻量级编译软件,具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等,是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。用它来运行Py...原创 2020-05-03 17:50:34 · 2851 阅读 · 0 评论 -
Python爬虫---一种甚是豪横的百度贴吧浏览方法
一般我们逛百度贴吧的时候都是这样子的输入感兴趣的内容后一点点看,今天给大家介绍一种新的贴吧浏览方法,是通过Python爬虫的方法首先引入所需模块import urllibimport urllib.request#导入urllib2首先自定义几个所需的函数(1)根据url发送请求,获取服务器响应文件def loadPage():(2)将html内容写入到本地def wr...原创 2020-05-03 16:39:53 · 348 阅读 · 1 评论 -
Python爬虫---你平时是怎样使用有道翻译的?
你平时是怎样使用有道翻译的?一般人都是这样使用的吧:1.打开有道翻译2.输入要翻译的字符3.复制翻译内容,over是的,我们都是这样使用有道翻译的,但是今天我要教大家一种通过Python爬虫使用有道翻译的方法!首先我们来讲一下POST请求和GET请求的区别最显著的区别就是Get请求的url会附带查询参数,查询参数在QueryString里保存Post请求的url不会附带查询参数...原创 2020-05-03 16:15:51 · 315 阅读 · 0 评论 -
POST data should be bytes, an iterable of bytes, or a file object. It cannot be of type str.
今天写Python爬虫POST请求有道翻译使出现了以下问题:开始百思不得其解,想了好久,发现还是转码的时候没有转成bytes类型主要修改两个地方1.通过urlencode转码时,在最后面加 encode(‘utf-8’)data=urllib.parse.urlencode(formdata).encode("utf-8")#转码print(urllib.request.ur...原创 2020-05-03 15:40:41 · 602 阅读 · 0 评论 -
Python爬虫爬爬爬----有时间来看一下爬虫设计思路,爬虫原理,通用爬虫和聚焦爬虫的区别
什么是爬虫,为什么要用Python做爬虫,什么是聚焦爬虫,什么是通用爬虫?小朋友,你是否有很多问号???这篇博客来一一的解析一下爬虫其实就是一段抓取网页数据的程序那么爬虫怎样抓取网页数据呢?主要为以下内容:我们首先要知道网页的以下基本特点:1、每个网页都有自己的URL(统一资源定位符)来进行定位2、网页都使用HTML(超文本标记语言)来描述页面信息3、网页都使用HTTP、HTTPS...原创 2020-04-14 21:43:37 · 805 阅读 · 0 评论