shell解析html网页,Windows PowerShell解析HTML本地文件

本文介绍如何使用 PowerShell 3.0 或更高版本的 Invoke-WebRequest 命令来获取网页内容,并通过解析 HTML 获取特定元素的属性。示例展示了如何从指定的 Web 页面中提取国家/地区名称及其代码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

如果您运行的是PS 3.0或更高版本,则可以利用Invoke-WebRequest获取网络上存在的网页。如果您对本地文件it can be a bit finicky进行操作。

Invoke-WebRequest返回一个HtmlWebResponseObject,其中包含一个名为ParsedHtml的属性。这个对象有一个名为getElementById的方法,我们可以使用它,因为我们知道select标签上的id“id_country”。从那里,迭代选项标签并过滤以返回我们想要的属性......“文本”和“值”是一件简单的事情。

以下示例输出包含国家/地区名称和国家/地区代码的自定义对象:

代码:

# I'm using your raw pastebin endpoint for this example

$result = Invoke-WebRequest "http://pastebin.com/raw.php?i=b8cShFLA"

# Only return specific properties from the elements you're looking for

$countries = $result.ParsedHtml.getElementById("id_country") |

Where tagName -eq "option" |

Select -Property Text, Value

# Country name and code are stored to this variable

$countries

输出:

text value

---- -----

Afghanistan af

Albania al

Algeria dz

American Samoa as

Andorra ad

... ...

然后,您可以像使用powershell对象上的任何其他属性一样使用国家/地区名称和代码。

对于Web端点,听起来您可以修改此脚本以指向您从中提取此HTML的原始Mozilla页面?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值