从ISO网站解析标准查询网址

from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
import time
‘’’

设置 ChromeDriver 路径

chrome_driver_path = ‘chromedriver.exe’

创建 ChromeDriver 服务对象

service = Service(chrome_driver_path)

创建 Chrome 浏览器对象

driver = webdriver.Chrome(service=service)
‘’’
driver = webdriver.Chrome()

打开目标网站

url = “https://www.iso.org/search.html?PROD_isoorg_en%5Bquery%5D=14577-” #根据查询内容更改网址,也可以不更改
#url = “https://www.iso.org/search.html?PROD_isoorg_en%5Bquery%5D=ISO%2014577-” #查询内容的空格用%20
driver.get(url)
#print(f"查询网址:{url}")

等待页面加载完成(可根据实际情况调整等待时间)

time.sleep(25) #网页打开等待期间,需要手工将查询关键词输入搜索框中

找到所有 class 为 “h5 card-title” 的 div 元素

遍历这些 div 元素,提取其中 a 标签的 href 属性值

divs = driver.find_elements(By.CSS_SELECTOR, ‘div.h5.card-title’)
for div in divs:
print(div.text)
a_tag = div.find_element(By.TAG_NAME, ‘a’)
href = a_tag.get_attribute(‘href’)
print(href)
#title = a_tag.get_attribute(‘title’)
#print(title)

关闭浏览器

driver.quit()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值