python 抓取网页数据基于BeautifulSoup

该博客介绍了如何利用BeautifulSoup库从指定网址抓取彩票历史数据,包括期号、红球号码和篮球号码,并将数据存储到数据库中。通过批量插入的方式提高了数据处理效率,适合大数据量的情况。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

使用BeautifulSoup 以抓取彩票往期数据为例
导入模块
安装模块  pip install bs4
导入  from bs4 import BeautifulSoup

在这里插入图片描述

# 获取页面内容
data = requests.get('http://datachart.500.com/ssq/history/newinc/history.php?limit=200&sort=0')
# 创建解析对象
html = BeautifulSoup(data.text,'html.parser')
list =[]
# 获取所有满足条件的值  返回list     
for tag in html.find_all('tr',class_='t_tr1'):  
    qihao = tag.find('td').get_text()  #期号   获取第一个td标签
    honqiu = '' #红球
	# 获取所有号码
    for haoma in tag.find_all('td',class_='t_cfont2'):  
        honqiu += haoma.get_text()+','   # 这里我拼接成string 
    honqiu = honqiu[0:-1:]  # 切割
    lanqiu = tag.find('td',class_='t_cfont4').get_text()  #篮球 
    list.append(Haoma(qihao=qihao,number=honqiu,lan=lanqiu))
	# 这里写了两种插入方式  迭代插入  批量插入   
    # Haoma.objects.bulk_create(qihao=qihao,number=honqiu,lan=lanqiu)  
    # hao.save()
# 批量插入 
Haoma.objects.bulk_create(list)
数据量大的时候,两种写入方式较为明显
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值