爬取菜鸟教程python题100列

最新推荐文章于 2022-11-15 08:15:00 发布

原创最新推荐文章于 2022-11-15 08:15:00 发布 · 683 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python

py学习专栏收录该内容

2 篇文章

订阅专栏

本文介绍了一种使用Python进行网页爬取的方法，通过requests库获取网页内容，BeautifulSoup解析HTML，实现了从Runoob网站自动抓取Python代码示例并保存到本地的功能。代码中包含了请求网页、错误处理、HTML解析和文件写入等关键步骤。

import requests
from bs4 import BeautifulSoup

def getHTMLText(url):
    try:
        r = requests.get(url,timeout=30)
        r.raise_for_status()
        r.encoding=r.apparent_encoding
        return r.text
    except:
        return ""
def SoupDemo(html):
    Work = ""
    for i in range(len(soup.select('#content'))):
	#print(soup.select('#content')[i].get_text().strip())
	Work +=soup.select('#content')[i].get_text().strip()
    return Work

def WriteText(name,Text):
    f = open(name,'w')
    f.write(Text)
    f.close()

main():
    for i in range(1,101):
        url="https://www.runoob.com/python/python-exercise-example{}.html".format(i)
        Text=getHTMLText(url)
        Work=SoupDemo(Text)
        WriteText('work{}',Work).format(i)
main()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

「已注销」

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

爬取菜鸟教程Python100例

Jaeshn

11-11

7827

爬取解析菜鸟教程Python100例页面，得到所有例子的题目、程序分析和代码，并存入txt文件。 #_*_ coding:utf8 _*_ import requests from bs4 import BeautifulSoup # 1、获取链接，解析链接 url = 'https://www.runoob.com/python/python-100-examples.html' heade...

python 爬取菜鸟教程python100题，百度贴吧图片反爬虫下载，批量下载

YmeBtc的博客

10-07

1645

每天一点点，记录学习 python 爬取菜鸟教程python100题 1:确定要抓取的数据字段（标题，题目与程序分析）； 2:分析页面html标签结构； 3:选择实现方法及数据存储位置（存储为文本文件即可）；目标url连菜鸟教程python100题url连接 https://www.runoob.com/python/python-100-examples.html 但是这个界面只有100道题...

2 条评论您还未登录，请先登录后发表或查看评论

2 条评论

weixin_43940444 2020.10.19
大佬你这代码缩进没对齐，SoupDemo函数里的html更没应用到，soup指的是html吧？我看了半天一脸懵逼
- weixin_43940444回复weixin_43940444 2020.10.19
  还有beautifulsoup也完全没有应用到，就是个摆设