python爬虫Beautiful Soup基础知识--第二篇用post方式获取网页请求

from bs4 import BeautifulSoup
import requests
import urllib.request
#模拟一个浏览器请求
head = {"user-agent": ""}
url="https://movie.douban.com"#第一个页面
request = urllib.request.Request(url, headers=head)#创建了一个HTTP请求对象
response=urllib.request.urlopen(request)#发送请求并接收响应:
html=response.read().decode('utf-8')
bs=BeautifulSoup(html,'html.parser')
print(bs.title)

user-agent自己补充

# -*- codeing = utf-8 -*-
# @Time:2024/10/30 19:27
# @Author : 
# @File : mybs.py
# @Software : PyCharm

from bs4 import BeautifulSoup
import requests
import urllib.request


def askurl(url):
    #模拟一个浏览器请求
    head = {"user-agent:" "}
    request = urllib.request.Request(url, headers=head)#创建了一个HTTP请求对象
    response=urllib.request.urlopen(request)#发送请求并接收响应:
    html=response.read().decode('utf-8')
    bs=BeautifulSoup(html,'html.parser')
    print(bs.a.text)

def main():
    baseurl = "https://movie.douban.com/top250?start="  # 第一个页面
    for i in range(0,10):
        url = baseurl + str(i*25)
        askurl(url)

if __name__ == '__main__':          #当程序执行时
#调用函数
    main()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值