通过requests和re两个模块来爬取豆瓣电影TOP250的电影名称:
# coding:utf-8
# 1.导入模块
import requests
import re
# 2.定义url与head
url = "https://movie.douban.com/top250"
headers = {
"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0.0 Safari/537.36"
}
# 3.定义正则表达式,给将要匹配的内容分组,并取名为name
# (?P<name>) 匹配圆括号中的正则表达式并指定一个组,且该组获得名称name