文章标题

POWERSHELL写爬虫

读取网页:invoke-webrequest命令

命令别名:wget

1. 命令格式与参数

(1) 命令格式
$html = wget http-address
(2) 命令参数

a. -outfile 将网页输出到文件
b. -method 指定HTTP method
c. -credential 指定用户验证信息
d.-useragent 指定使用的浏览器特征

2. 命令返回值结构

a. Forms 所有表单,Array,可能为空
b. innerHTML/TEXT,链接本身的名字/文字
c. outerHTML/TEXT,链接显示的名字/文字
d. href,链接地址
e. Class, 标签里class=的内容
f. allelements,Property,所有的属性

举例:

$elements = $html.allelements | where class -eq "seedtable"
筛选所有class==seedtable的内容

3.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值