上一篇里面已经有一种方法了,现在再介绍两种
def get_input(html):
data = {}
soup = BeautifulSoup(html, 'html.parser')
inputs = soup.form.findAll('input')
for input in inputs:
if input.get('name'):
data[input.get('name')] = input.get('value')
return data
from lxml import etree
def get_video_url(page_url):
response = requests.get(page_url).text
selector = etree.HTML(response.encode('utf-8'))
x = selector.xpath('//*[@id="player"]/script/text()')
return re.findall('src="(.*?)&', x[0])[0]
本文介绍了一种从HTML中获取表单输入字段的方法,并提供了一个使用Python的BeautifulSoup库解析网页表单的具体实例。此外,还介绍了如何利用lxml和正则表达式来提取网页上的视频源地址。
1020

被折叠的 条评论
为什么被折叠?



