记录使用selenium4.15.2中CLASS NAME定位失败

本文讨论了在HTML中,如何正确使用`span-bluepointer`中的`span-blue`类名进行元素定位,指出将其作为定位器是错误的,应直接使用pointer。通过前后对比,展示了定位失败和修复后的成功案例。

这个span-blue pointer中的span-blue是类名,不能用来当元素定位,正确的用法是直接使用pointer

定位失败

修改后定位成功

我需要开发一款软件,为以下代码提供一个有界面的程序,界面使用tkinter,如果代码中涉及需要额外安装的第三方库请再给我一个对应的安装要求文件。 第一步 获取用户信息 secUid和uid和作品数实现如下: import datetime import json import os import random import re import time import webbrowser from time import sleep from urllib import parse from loguru import logger from configobj import ConfigObj import execjs import requests from selenium.webdriver.chrome.service import Service from selenium.webdriver.common.by import By from win10toast import ToastNotifier requests.packages.urllib3.disable_warnings() from selenium import webdriver from bs4 import BeautifulSoup # import Util # 指定浏览器打开网页 firefoxPath = r"C:\Program Files\Mozilla Firefox\firefox.exe" webbrowser.register('firefox', None, webbrowser.BackgroundBrowser(firefoxPath)) # 浏览器设置 option = webdriver.ChromeOptions() # 以最高权限运行 option.add_argument('--no-sandbox') # 开发者模式的开关,设置一下,打开浏览器就不会识别为自动化测试工具了 option.add_experimental_option('excludeSwitches', ['enable-automation']) option.add_argument('--ignore-certificate-errors') option.add_argument('--ignore-ssl-errors') # # 指定缓存位置 # option.add_argument(r'--disk-cache-dir=G:\python项目\凌风抖音监控还原\cache') # option.add_argument(r'--user-data-dir=G:\python项目\凌风抖音监控还原\cache') # 处理SSL证书错误问题 option.add_argument('--ignore-certificate-errors') option.add_argument('--ignore-ssl-errors') # 忽略无用的日志 option.add_experimental_option("excludeSwitches", ['enable-automation', 'enable-logging']) option.add_argument('--no-sandbox') # 给予root执行权限 s = Service('chromedriver.exe') tplt = "{0:{3}^22}\t{1:^8}\t{2:^8}" today = str(datetime.date.today()) video_save_lv = f"D:\\监控视频下载\\{today}" if not os.path.exists(video_save_lv): os.mkdir(video_save_lv) def get_secUid(): """ 登录获取UID :return: """ global headers browser = webdriver.Chrome(service=s, options=option) url = 'https://www.douyin.com/user/self' # cookie 登录 if os.path.exists("cookies.txt"): # 从9828_cookies.txt文件读取cookies with open("cookies.txt") as f2: cookies = json.loads(f2.read()) # 使用cookies登录 browser.get(url) for cook in cookies: browser.add_cookie(cook) # 刷新页面 browser.refresh() while True: sleep(5) if "用户名" in browser.title: break else: browser.get(url) user_input = input("登录:") # 获取cookie cookies = browser.get_cookies() print(cookies) with open("cookies.txt", "w") as f: f.write(json.dumps(cookies)) # 存储header供requests使用 headers = {'user-agent': "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:109.0) Gecko/20100101 Firefox/116.0"} cookies = browser.get_cookies() cookie_string = '' for cookie in cookies: cookie_string = cookie_string + cookie['name'] + '=' + cookie['value'] + ';' headers['cookie'] = cookie_string headers['referer'] = "https://www.xxx.com/user/self?showTab=record" headers['TE'] = "trailers" headers['Sec-Fetch-Dest'] = "empty" headers['Sec-Fetch-Mode'] = "cors" headers['Sec-Fetch-Site'] = "same-origin" headers['Host'] = "www.douyin.com" # 获取 secUid, uid, 关注数量 res = re.findall('<script id="RENDER_DATA" type="application/json">(.*?)</script>', browser.page_source)[0] res = requests.utils.unquote(res) secUid = json.loads(res)['app']['user']['info']['secUid'] uid = str(json.loads(res)['app']['user']['info']['uid']) followingCount = json.loads(res)['app']['user']['info']['followingCount'] logger.info(f"secUid:{secUid}, uid: {uid} 关注博主:{followingCount}") # print(secUid) browser.quit() return (secUid, followingCount, uid, headers) 第二步 开始轮询: def check_index(url_list): """ 开始检查的作品数的主程序 :param url_list: 用户作品列表数 :return: """ count = 1 # 计数开始 while True: start_time = datetime.datetime.now() # 计时开始 # 打开本地json文件读取上次检查信息 if get_all_following_list(url_list): count += 1 sleep(random.randint(5, 10)) end_time = datetime.datetime.now() # 计时结束 # 处理输出时间格式 count_time = str(end_time - start_time) count_time = count_time.split(":", 1)[-1] count_time = count_time.split(".", 1)[0] # count_time = round(count_time, 2) logger.info(f"【{count}】轮监控中,耗时: 【{count_time}】 {str(datetime.datetime.now().time())[:8]}\n") print("-"*50)
最新发布
09-18
使用 Selenium 进行元素定位时,通过 `class_name` 定位是一种常见方式,但有时会遇到无法通过 `class_name` 成功定位元素的问题。这通常与 HTML 中的 class 属性结构、动态生成的 class 名称或元素尚未加载完成等因素有关。 ### 常见原因及解决方法 #### 1. **class 名称中包含空格** HTML 中的 `class` 属性可以包含多个类名,以空格分隔。如果目标元素的 `class` 属性中包含多个类名,例如 `class="form-control input-lg"`,使用 `find_element_by_class_name("form-control input-lg")` 会失败,因为 `find_element_by_class_name` 方法仅接受单个类名作为参数。 **解决方法:** 使用 CSS 选择器或 XPath 来精确匹配多个类名: ```python # 使用 CSS 选择器 driver.find_element_by_css_selector(".form-control.input-lg") ``` #### 2. **class 名称是动态生成的** 在现代前端框架(如 React、Vue)中,class 名称常常是动态生成的,例如 `class="abc123"`,这使得直接使用 `class_name` 定位变得不可靠。 **解决方法:** 改用 CSS 选择器或 XPath 结合部分匹配: ```python # 使用 CSS 选择器的部分匹配 driver.find_element_by_css_selector("[class*='abc']") ``` #### 3. **元素尚未加载完成** 如果在页面加载完成之前尝试定位元素,可能会导致定位失败。 **解决方法:** 使用显式等待(Explicit Wait)确保元素加载完成后再进行操作: ```python from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC # 等待元素可见 element = WebDriverWait(driver, 10).until( EC.visibility_of_element_located((By.CLASS_NAME, "form-control")) ) element.send_keys("test") ``` #### 4. **多个相同 class 名称的元素存在** 如果页面中存在多个具有相同 class 名称的元素,`find_element_by_class_name` 会返回第一个匹配的元素,可能不是预期的目标。 **解决方法:** 使用 `find_elements_by_class_name` 获取元素列表后进行筛选: ```python elements = driver.find_elements_by_class_name("form-control") for element in elements: if element.is_displayed(): element.send_keys("test") break ``` #### 5. **使用了不支持的定位方式** Selenium 的 `find_element_by_class_name` 方法在某些浏览器或驱动版本中可能存在兼容性问题。 **解决方法:** 改用通用的 `find_element` 方法并指定定位策略: ```python from selenium.webdriver.common.by import By element = driver.find_element(By.CLASS_NAME, "form-control") ``` ### 示例代码 以下是一个完整的示例代码,展示了如何使用显式等待和 CSS 选择器来更可靠地定位元素: ```python from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC # 初始化浏览器驱动 driver = webdriver.Chrome() # 打开目标网页 driver.get("https://www.example.com") # 等待 class 为 "form-control" 的元素可见 element = WebDriverWait(driver, 10).until( EC.visibility_of_element_located((By.CSS_SELECTOR, ".form-control")) ) # 输入文本 element.send_keys("test") # 关闭浏览器 driver.quit() ``` ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

测试开发ing

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值