在python3.x中使用BeautifulSoup稍有不同,请参照下面
import urllib.request
from bs4 import BeautifulSoup
url = input("Enter-")
html = urllib.request.urlopen(url)
soup = BeautifulSoup(html,'html.parser')
tags = soup('a')
#soup相当于建立一个dict()
for tag in tags: print(tag.get('href',None))
本文介绍如何使用Python3和BeautifulSoup库进行网页爬取。通过示例代码,详细展示了从输入URL到解析HTML并获取所有链接的过程。适合初学者快速上手。
583

被折叠的 条评论
为什么被折叠?



