Python爬取网页title

最新推荐文章于 2025-06-27 17:43:52 发布

原创最新推荐文章于 2025-06-27 17:43:52 发布 · 1w 阅读

6 ·

CC 4.0 BY-SA版权

Python学习手册专栏收录该内容

2 篇文章

订阅专栏

本文介绍了一个使用Python进行网页抓取与解析的实际案例。通过urllib和BeautifulSoup库，文章详细展示了如何从指定URL获取网页内容，并进一步解析出页面标题的过程。此教程适合初学者了解网页抓取的基本步骤。

from urllib.request import urlopen
from urllib.error import HTTPError,URLError
from bs4 import BeautifulSoup

引入BeautifulSoup

下面是getTitle函数

def getTitle(url):
    try:
        html=urlopen(url)
    except (HTTPError,URLError) as e:
        return None
    try:
        bsObj=BeautifulSoup(html.read())
        title=bsObj.body.h1
    except AttributeError as e:
        return none
    return title
title=getTitle("http://www.pythonscraping.com/pages/page1.html")
if title==None:
    print("Title could not be found!")
else:
    print(title)