from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
import time
‘’’
设置 ChromeDriver 路径
chrome_driver_path = ‘chromedriver.exe’
创建 ChromeDriver 服务对象
service = Service(chrome_driver_path)
创建 Chrome 浏览器对象
driver = webdriver.Chrome(service=service)
‘’’
driver = webdriver.Chrome()
打开目标网站
url = “https://www.iso.org/search.html?PROD_isoorg_en%5Bquery%5D=14577-” #根据查询内容更改网址,也可以不更改
#url = “https://www.iso.org/search.html?PROD_isoorg_en%5Bquery%5D=ISO%2014577-” #查询内容的空格用%20
driver.get(url)
#print(f"查询网址:{url}")
等待页面加载完成(可根据实际情况调整等待时间)
time.sleep(25) #网页打开等待期间,需要手工将查询关键词输入搜索框中
找到所有 class 为 “h5 card-title” 的 div 元素
遍历这些 div 元素,提取其中 a 标签的 href 属性值
divs = driver.find_elements(By.CSS_SELECTOR, ‘div.h5.card-title’)
for div in divs:
print(div.text)
a_tag = div.find_element(By.TAG_NAME, ‘a’)
href = a_tag.get_attribute(‘href’)
print(href)
#title = a_tag.get_attribute(‘title’)
#print(title)
关闭浏览器
driver.quit()