使用selenium获取图书信息实例(完整代码)

本文提供了一个实例,展示了如何利用selenium库从人民邮电出版社官网获取图书搜索结果中的书名和价格信息。通过Chrome浏览器驱动,进行页面交互,最后用BeautifulSoup解析HTML并用pandas生成数据表格。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

   本文以人名邮电出版社官网为例来获取相关搜索内容图书的价格和书名信息,得到的结果再通过pandas里的DataFrame生成一个简单的表格。完整代码和有关解析如下:

#导入selenium的相关库

from selenium import webdriver
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.by import By 

driver=webdriver.Chrome()    #使用谷歌浏览器新建窗口,并创建一个名为driver的对象
driver.get('https://www.ptpress.com.cn/shopping/index')    #里面的是人名邮电出版社的网址
wait=WebDriverWait(driver,20)     #页面等待最长时间为20秒,否则报错

#下面括号里长长的内容是利用谷歌开发者工具获取的搜索框selector

search_btn=driver.find_element_by_css_selector(
     'body > div.classifySearch-p > div > div.classifySearchBar > div.allSearch > input'
)
search_btn.send_keys('python编程')    #传送数据到弹出的那个浏览器搜索框里面

#设置等待的特定条件,括号里长长的内容是开发者工具里面定位到搜索的selector

confirm_btn=wait.until(<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值