
python爬虫
文章平均质量分 65
程序猿沙弥
这个作者很懒,什么都没留下…
展开
-
python爬虫实例-运用requests抓取豆瓣电影TOP250(详解)
目录开发工具目标网页分析正则匹配分析代码实例总结 开发工具 python版本: python-3.8.1-amd64 python开发工具: JetBrains PyCharm 2018.3.6 x64 安装requests库(指定阿里镜像安装会很快) pip install requests -i http://mirrors.aliyun.com/pypi/simple/ -豆瓣电影TOP250网页地址https://movie.douban.com/top250 目标 获取豆瓣电影TOP250原创 2021-12-07 23:38:17 · 6639 阅读 · 1 评论 -
python爬虫-实现小说<战争与和平>中人物出场顺序显示所有人名
目录开发工具爬虫分析爬虫代码运行效果总结 开发工具 python版本: python-3.8.1-amd64 python开发工具: JetBrains PyCharm 2018.3.6 x64 安装BeautifulSoup库(指定阿里镜像安装会很快) pip install beautifulsoup4 -i http://mirrors.aliyun.com/pypi/simple/ 战争与和平小说网页地址http://www.pythonscraping.com/pages/war原创 2021-12-01 21:01:12 · 3095 阅读 · 0 评论 -
python爬虫问题-BeautifulSoup库运行提示GuessedAtParserWarning: No parser was explicitly specified
目录开发工具问题描述问题代码运行结果解决方案运行效果总结 开发工具 python版本: python-3.8.1-amd64 python开发工具: JetBrains PyCharm 2018.3.6 x64 安装BeautifulSoup库(指定阿里镜像安装会很快) pip install beautifulsoup4 -i http://mirrors.aliyun.com/pypi/simple/ 问题描述 GuessedAtParserWarning: No parser was expl原创 2021-11-30 22:17:52 · 4026 阅读 · 0 评论 -
python爬虫问题-爬取网页出现\r\n\t\t解决方案
目录开发工具问题代码运行结果解决方案运行效果总结 开发工具 python版本: python-3.8.1-amd64 python开发工具: JetBrains PyCharm 2018.3.6 x64 问题代码 from urllib.request import urlopen html = urlopen("https://www.baidu.com/s?wd=python%E7%88%AC%E8%99%AB%E4%B9%A6%E7%B1%8D") print(html.read()) 运行结原创 2021-11-30 21:56:42 · 4773 阅读 · 1 评论