python批量查询豆瓣书籍评分（教程附源码）

最新推荐文章于 2024-09-05 18:25:09 发布

原创

最新推荐文章于 2024-09-05 18:25:09 发布 · 3.5k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#python

本文介绍如何使用Python批量查询豆瓣书籍评分，详细解析获取书籍URL的接口及爬取评分的过程。提供了示例代码，包括利用豆瓣API的限制解决方法，并提及selenium作为备选方案。最终通过评分筛选出高分书籍。

在懒人盘分享的高分电子书是利用python批量查询得到的
发现常规的豆瓣api不允许调用了，几番搜索发现一个接口

https://book.douban.com/j/subject_suggest?q=书名

利用这个接口可以拿到书籍在豆瓣上的的url
在这里插入图片描述
获取单本书籍url的函数

def get_book(title):
    url = "https://book.douban.com/j/subject_suggest?q=%s"%title
    rsp = requests.get(url,headers=get_headers())
    rs_dict = json.loads(rsp.text)
    url_ = rs_dict[0]['url']
    print(url_)
    return get_detail(url_)
get_book("红楼梦")

运行该函数后可以得到url

https://book.douban.com/subject/1007305/

可以看到这就是豆瓣详情页了
在这里插入图片描述
接下来对详情页里的分数进行爬取


def get_detail(url):
    headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

懒人找资源

关注关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Python爬虫教程006：利用request + BeautifulSoup 模块批量爬取内容，实现批量获取书名对应的豆瓣评分

WwLK123的博客

07-22

448

摘要：本文展示了一个Python爬虫程序，用于批量查询豆瓣图书评分。程序通过requests库发送HTTPS请求，利用BeautifulSoup解析网页内容。主要包含两个函数：get_book()根据书名获取图书URL和封面图片，get_detail()提取图书详细页面的评分信息。程序测试了25本商业和管理类书籍，输出每本书名及其豆瓣评分，若未找到则返回提示信息。代码展示了网络爬虫的基础实现，包括用户代理设置、JSON数据处理和HTML解析等技术要点。

Python爬虫：如何爬取豆瓣电影数据（电影名称、评分、评论等）

最新发布

2201_76125261的博客

04-15

1048

豆瓣电影的数据尤为丰富，包括电影名称、评分、评论、演员信息等，这些数据对于进行电影分析、市场预测、用户偏好研究等都具有极高的价值。无论是静态页面数据的抓取，还是动态加载数据的提取，我们都提供了详细的代码示例。掌握这些爬虫技能后，您可以扩展到更多的应用场景，如电影推荐系统、用户评论分析、电影趋势预测等。在这篇博客中，我们将详细讲解如何使用Python爬虫来获取豆瓣电影的数据，包括电影名称、评分、评论等内容。接下来，我们来抓取电影的用户评论。等工具来抓取豆瓣电影的网页数据，并提供完整的爬虫实现代码。

参与评论您还未登录，请先登录后发表或查看评论

使用python批量爬取豆瓣书单图片

m0_68441755的博客

10-20

486

使用我们的遍历来获取属性值为.title-content-title这个的标签。# 使用with open 进行保存代码到我们的本地文件。#这一行是用来查看我们的状态码的，200是可以正常运行的。# 获取img标签的属性值src。#使用我们requests当中的get方法。# os模块判断并创建。#让我们全文的文本编码等于我们头部的。#将我们的r.text赋值给demo。# 设置文件夹的名字。#引入我们的requests库。#引入我们的pyquery库。

JAVA批量查询书籍信息-豆瓣读书

10-23

由于目前豆瓣读书搜索api已废弃了，官方也做反爬虫机制（用传统爬网页的方式不可取），搜索图书页面需要登录，用selenium方式取设置用户信息，多次尝试发现也不行（有可能是我的方式不对）。所以我只有用曲线救国的方式来实现搜索查询书籍信息了。由于目前豆瓣的书籍详情也没有标签信息了，为了能获取到书签，用了同样的方式对当当网进行抓取。需要批量时自己改一下代码就行了

java课后习题第一次作业

ysh的博客

11-19

950

目录P137-4p138-6P139-11P186-7P187-10P187-11P264-10P265-2P267-5P186-7另一种写法 P137-4 题目：编写一个程序，读取一行句子作为输人，然后显示下面的响应:如果这个句子以问号结尾，并且输人中包含偶数个字符，那么显示单词Yes。如果这个句子以问号结尾，并且输人中包含奇数个字符，那么显示单词No。如果这个子句以感叹号结尾，则显示单词Wow。对于所有其他情况，显示单词 You always say,后面跟着用引号括起来的输人字符串。你的输出应该全部

豆瓣电影评分爬取

weixin_63180938的博客

09-05

2857

对豆瓣网站的简单解析和爬取数据

基于Python爬虫与MySQL的豆瓣图书数据可视化系统

本项目“基于Python爬虫和MySQL的豆瓣图书数据可视化系统源码+数据（课程大作业）”是一个典型的综合性实践项目，融合了网络爬虫技术、数据库管理、后端服务开发以及前端数据可视化等多方面的计算机核心知识，适用于...

【python实战】23个爬虫项目源码：微信、淘宝、知乎、微博...

热门推荐

公号：一条coding

06-04

1万+

23个Python爬虫项目

Python爬虫入门：实战爬取豆瓣TOP250图书信息

"Python爬虫入门教程，讲解如何爬取豆瓣TOP250图书信息，包括书名、链接、评分等数据。" 在Python爬虫领域，获取网页数据是基础技能之一。本教程以豆瓣TOP250图书页面为例，讲解如何使用Python进行网页数据抓取。...

python豆瓣历史评分_python快速查豆瓣评分

weixin_39940957的博客

12-03

1043

当我们听说了一部电影的时候，习惯性地回去豆瓣查它的评分，然后再决定看不看。现在的一些豆瓣爬虫程序，都要爬取很多用不上的信息，而且能够指定影片搜索的也不常见。真正影响我们是否看某个影片的因素，主要只有评分和评论，但评论看多了，难免会被一些差评所影响，甚至剧透，错过一部好片子。所以最客观的因素，还得是豆瓣评分，今天我们就自己写一个非常简易的快速查分程序。在这里，我们用的不是豆瓣的常用url，而是另辟蹊...

豆瓣API获取书籍详细信息（Java代码）

01-08

使用豆瓣API，根据书籍ISBN码，获取该本书籍的详细信息

【python--爬虫】豆瓣读书用户评分爬虫

qq_43017750的博客

03-07

3770

豆瓣读书用户评分爬虫最近有好友不会做豆瓣读书的评论和评分的爬虫求助博主，博主做完后发给了该好友，本着造福小白的心理，博主在这里给大家分享自己写的豆瓣爬虫。 1.分析网页这里我们先随便打开一本书的评论（https://book.douban.com/subject/30442488/comments/）在页面源代码中查找评论的位置，在class属性为&quot;short&quot;的&amp;lt;span&amp;gt;标.

R语言编写函数——豆瓣电影评分查询

路漫漫其修远兮吾将上下而求索

02-24

2627

作为一个伪影迷，经常纠结一些电影该不该下，要不要看。毕竟吾生也有涯而片源无涯。还好可以去豆瓣一类的地方看看大家的评分择优录用。去豆瓣查分需要登录网站搜索再鼠标点点点，如果要查好几部电影就有点费事儿。其实可以用R写个函数，先抓取相应的网页，再筛选返回需要的分值。这样在R里头就可以批量查分了，恩，走起来。library(RCurl) library(XML) movieScore <- function

爬虫 | 百行代码爬取14.5W条豆瓣图书信息

咸鱼学Python的博客

06-03

307

前言先上一波爬取的结果：数据库中部分截图实战引入类库import requests from bs4 import BeautifulSoup from requests.excepti...

用Ruby批量获取电影的评分与影片信息

weixin_34144848的博客

05-06

295

相信很多像我一样的技术宅喜欢窝家里看电影，现在的硬盘随随便便都是几百G好几T的，里面没个百部八十的都不好意思跟人打招呼。下得多了，但好电影真的不多，特别是像我这个大陆分类文件夹里，很多看完发现真的是浪费时间。用ruby写了个小程序，从豆瓣电影上扒评分跟影片信息，将它们拼接成一个html网页，处理一个文件夹里的电影后能得到类似于下面的结果：你也可以扩充后，添加譬如： 1.在你硬盘每个电影文...

喜欢看电影来哦！教你如果使用Python网络爬虫爬取豆瓣高分电影！

y4544159的博客

09-30

4696

python大规模获取豆瓣影评_python自动获取豆瓣电影评分和影评

weixin_39876650的博客

11-29

651

介绍了博客搭建过程，因为不间断上新超清电影，所以打算在公众号推文里也加以介绍，考虑到网站里已经有影视详情了，不妨在推文里附上汁源网上新的电影豆瓣评分和热门影评。之前写过文章调用豆瓣读书的api了，把book改成movie就可以查到详情url，然后到详情页获取封面和评分以及影评。使用markdown语法批量生成，再粘贴到预览页里生成推文，最后粘贴到公众号里，一篇文章就这样搞定了。以下为懒人资源网最新...

使用豆瓣api查书的js

要耐得住寂寞

09-20

406

[b]jquery版[/b] [code="html"] Books: new 添加新书到共享书库输入ISBN: Isbn Name [/code] [code="j...

oracle 两行数据合并成一行_PowerBI批量获取豆瓣电影数据全流程

weixin_39829574的博客

12-10

444

2020年的电影市场沉寂了大半年，随着国庆档几部影片的上映，差不多恢复到了往年的热度，不过打算看哪部电影不能仅看是否热门，更靠谱的是参考电影评分，更准确的说，是看豆瓣的评分。这篇文章就来看看如何用PowerBI批量抓取豆瓣电影的数据。以最近正在上映的电影为例，豆瓣网址为：https://movie.douban.com/利用从web获取数据的功能，将这个网址放进去，就可以轻松获取这些影片的评分：这...