确定使用 BeautifulSoup4 获取 input 的 value 值
今天接到一个解析网页内容的需求,要我从网页里找出订单号。
和往常一样,我不管现在流行什么,只是习惯性的首选了前些年最多人用的BeautifulSoup4
。
扫了一眼要解析的网页代码,发现挺简单的,我只需要通过其中一个input
标签的id
去取它对应的value
值就可以了。
流程很简单,导入包,加载要解析的HTML代码,拿出结果
自信的输入代码,结果:翻车!
发现好久没有更新BeautifulSoup4
的文件了。
成功更新后,马上啪啪一顿码代码:
# 导入BeautifulSoup4的包
from bs4 import BeautifulSoup
# 放入要解析的HTML代码,可以看到,只需要取 id 为 order_id 的 value 就可以了
html_source = "<input type=\"hidden\" id=\"order_id\" value=\"2021-05-15-1234\" />"
# 开始解析代码
html_soup = BeautifulSoup(html_source, "html.parser")
# 查找 id 为 order_id 的 input 标签,获取其 value 属性的值,将其保存到变量 order_value 中
order_value = html_soup.fin