影刀RPA中级证书-网页进阶-元素操作

1.操作题需求

按要求实现以下流程:

1. 进入影刀商城 — 网页操作页面,网址 影刀商城  账号:admin   密码:58T2$!hm
2. 复选框依次勾选上剩余四个复选框
3. 单选框选择“C”
4. 下拉框选择“香蕉”
5. 使用设置动态元素的方法,选择“D:让软件机器人来帮助我工作”
6. 拖拽第一个滑动条至最大值
7. 拖拽第二个滑动条至中间位置

2.实战代码

2.1 打开网页

2.2 复选框依次勾选上剩余四个复选框

可以依次捕获复选框元素,通过点击元素实现,这里使用循环相似元素组实现

2.3 单选框选择“C”

2.4 下拉框选择“香蕉”

2.5 使用设置动态元素的方法选择

2.6 拖拽元素

这个作业还是比较简单的,都是基础指令操作。

整体代码

3.知识点

  • 网页元素复选框
  • 网页元素单选
  • 网页元素下拉选择,非标准下拉框选择,主要是非标准下拉框,很多网站都是这种网页布局
  • 网页元素拖拽

4.最后

感谢大家,请大家多多支持。

UiPath目前已掌握的程度(单选) 刚刚起步学习 已经通过L1:FoundationTraining 已通过L2:OrchestratorTraining 已通过L3:AdvancedTraining 在https://platform.uipath.com/中注册账号并登录;这里建议全部使用英文,不要用中文。至于注册的步骤,想必大家都很清楚,我就不用再啰嗦了。 注册完之后,登录到系统中,增加点击Services,增加一个自己的账户。 增加服务时,填写里面的个数时,尽量根据下面的提示,有2个可用,就填写2,有1个可用,就填写1. 点击自己刚刚新增的账户,就会进入到管理界面 可以在左下角设定界面的语言。 启动本地机器人,会显示在屏幕的右下角。 点击鼠标右键,会出现下面的界面,选择【OrchestratorSettings】 复制机器名称【Machine Name】 切换到Orchestrator管理界面,增加一个标准机器,并将复制的机器名称粘贴到这里 点击加号,选择【标准机器人】,粘贴刚刚复制的机器名称,点配置 点击下图中的编辑,即可查看MachineKey 新建一个标准机器人,输入本地计算机的账号和密码,类型为Development 创建步骤如下: 切换到环境,新建一个环境 输入新环境的名称,点击创建 在新建的环境中,指定刚刚新建的机器人 点击计算机,选择刚刚建立的标准机器,复制MachineKey 点击本地机器人,选择连接Orchestrator, A:在URL中输入第一步的网址 B:在MachineKey中,粘贴MachineKey 最后一步:在本机机器人连接成功的状态下,点击发布,即可将本地流程发布到Orchestrator上。 发布成功之后会弹出下面的框 目前本地机器人流程还是空的 发布之后,我们切换到Orchestrator上,选择流程,点击加号,选择我们刚刚发布的流程,最后点击创建。 现在我们在左键点击屏幕右下角的本地机器人图标,会出现 点击最右侧的下载图标,进行安装,安装好之后,点击它即可执行。
### 使用影刀RPA实现网页评论抓取 #### 准备工作 为了成功利用影刀RPA进行网页评论的抓取,需先安装并配置好影刀软件环境。确保已获取目标网站访问权限以及遵循其服务条款。 #### 定位页面元素 识别要抓取的目标网页结构及其HTML标签特征对于编写稳定可靠的脚本至关重要。通常情况下,评论区会由特定类名或ID标记[^1]。例如,在某些论坛上,每条评论可能被包裹在一个`<div>`内,并赋予独一无二的CSS选择器路径。 ```python # Python模拟查找元素方式 (仅作示意) from selenium import webdriver driver = webdriver.Chrome() driver.get('https://example.com') comments_elements = driver.find_elements_by_css_selector('.comment-item') # 假设每个评论项都有此class名称 ``` #### 数据提取逻辑 一旦确认了用于定位单个评论条目的XPath或其他查询表达式之后,就可以循环遍历这些节点来读取消息正文、用户名以及其他感兴趣的字段。这里可以借助于正则表达式或者简单的字符串方法完成进一步的数据清理和转换任务。 ```python for element in comments_elements: user_name = element.find_element_by_class_name('username').text.strip() comment_text = element.find_element_by_tag_name('p').get_attribute('innerText').strip() print(f'User: {user_name}, Comment: "{comment_text}"') ``` #### 处理分页加载机制 许多在线平台采用无限滚动或是点击“查看更多”的形式呈现全部留言记录。针对这种情况,可以通过监听新内容加入DOM事件触发点或者是模拟人工交互动作直至无法再加载更多为止。 ```python while True: try: load_more_button = driver.find_element_by_link_text('Load More Comments') load_more_button.click() time.sleep(2) # 给服务器响应时间 except Exception as e: break # 当找不到按钮时停止尝试 ``` #### 存储收集到的信息 最后一步就是决定怎样保存所获得的结果集。可以选择将其导出成CSV文件以便后续分析;亦或将它们直接存入关系型数据库中方便长期维护管理。 ```sql INSERT INTO web_comments(user, content) VALUES ('John Doe', 'This is a great product!'); -- SQL语句作为概念验证用途 ``` 通过上述流程说明,可以看出使用影刀RPA工具确实能极大简化重复性的网络数据采集过程,提高效率的同时也减少了人为错误的发生几率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

微刻时光

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值