
爬虫
qq_42241932
这个作者很懒,什么都没留下…
展开
-
爬虫入门一
一、爬虫的概念1、什么是爬虫?(对于程序员和互联网)程序员:写程序,然后去互联网上抓取数据的过程互联网:网,由好多的a连接组成的,网的节点就是每一个a连接 url(统一资源定位符)2、那些语言可以实现爬虫php,,可以做,号称世界上最优美的语言,多进程,多线程支持的不好java,也可以做爬虫,但是代码臃肿,重构的成本大c、c++,这个是你能力的体现,不是良好的选择python,...原创 2019-04-27 13:57:34 · 288 阅读 · 0 评论 -
爬虫入门二——post
爬取百度翻译处理数据的过程【表单数据的处理】form_data = urllib.parse.urlencode(form_data).encode()import urllib.requestimport urllib.parsepost_url = 'https://fanyi.baidu.com/sug'word = input('请输入你要查询的英文单词:')#构建post...原创 2019-04-27 19:09:12 · 1014 阅读 · 0 评论 -
爬虫入门三——爬取贴吧
需求:输入吧名,输入起始页码,输入结束页码,然后再当前文件夹中创建一个以吧名为名字的文件夹,里面是每一页的html内容,文件名是吧名_page.htmlimport urllib.requestimport urllib.parseimport osurl = 'http://tieba.baidu.com/f?ie=utf-8'ba_name = input('请输入吧名:')sta...原创 2019-04-27 19:13:57 · 403 阅读 · 0 评论