
爬虫
文章平均质量分 58
褚骏逸
这个作者很懒,什么都没留下…
展开
-
豆瓣爬虫:模拟登录(可直接在cmd执行)
【本代码可直接顺序复制粘贴,并用cmd运行。注意:https不要写成http】先查看一下登录所需的信息。登录页面https://accounts.douban.com/login按[F12]打开网页源代码 - 按[F8]寻找redir - 可将redir的value值设为你想跳转的页面。我设为http://movie.douban.com/mine?status=collect,跳转到...原创 2018-10-31 10:22:50 · 454 阅读 · 0 评论 -
豆瓣爬虫(从剧名获取ID)
假设只知道剧名列表 ['战火西北狼','武林外传'],想爬取其豆瓣信息。首先我要知道它的豆瓣ID,这样才能更好地连接到该剧的信息页。 1.载入包# coding: utf-8import urllib.requestimport pandas as pdimport urllib.parseimport requestsimport reimport matplotli...原创 2018-10-30 11:09:22 · 6500 阅读 · 6 评论