Python每日练习：爬取在线课程

最新推荐文章于 2025-11-26 15:40:52 发布

程序才子

最新推荐文章于 2025-11-26 15:40:52 发布

阅读量169

点赞数 1

CC 4.0 BY-SA版权

文章标签： python 爬虫开发语言 Python

本文链接：https://blog.youkuaiyun.com/TechWhiz/article/details/132771775

Python 专栏收录该内容

144 篇文章 ¥59.90 ¥99.00

订阅专栏

本文介绍如何使用Python的requests和BeautifulSoup库爬取在线课程平台，如Coursera，提取课程标题和链接。通过安装相关库、发送HTTP请求、解析HTML页面，实现了数据抓取。遵循网站使用条款，尊重隐私政策。

Python每日练习：爬取在线课程

在这篇文章中，我们将探讨如何使用Python进行网络爬虫，以获取在线课程的信息。我们将使用Python的一些库和模块来实现这个目标。让我们开始吧！

首先，我们需要安装几个必要的Python库。我们将使用requests库发送HTTP请求，以获取网页的内容。我们还将使用BeautifulSoup库来解析HTML页面，以便提取所需的数据。您可以使用以下命令安装这些库：

pip install requests
pip install beautifulsoup4

一旦我们安装了这些库，我们就可以开始编写我们的爬虫代码了。首先，让我们导入所需的库：

import requests
from bs4 import BeautifulSoup

接下来，我们需要确定要爬取的目标网页。假设我们要爬取一个在线课程平台，比如Coursera。我们可以使用以下代码发送HTTP请求并获取页面内容：

url = 'https://www.coursera.org/'
response

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

程序才子

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

Python每日一练(11)-爬取在线课程

棒棒编程修炼场

04-11

2535

目录1. 爬取在线课程Excel版2. 爬取在线课程MySQL版 1. 爬取在线课程Excel版昨天呢笔者外出去吃了一顿火锅，疫情期间在家馋了好久勒，所以就没有更新Python的每日一练，今天中午吃了饭之后，赶紧打开电脑给补上，嘿嘿。今天的案例主要是去爬取网易云课堂上与Python相关的1200多门课程。如图所示。如果我们要在网易云上发布一门Python课程，那么就要对竞品进行分析。而要对竞品...

Python大作业——爬虫+可视化+数据分析+数据库

2401_84140653的博客

04-29

355

一、登录界面登录界面将与主界面同大小，且为了方便布局，设置为固定大小不可改变self.setWindowTitle(‘登录’) # 设置窗口名称self.setWindowIcon(QIcon(‘favicon.ico’)) # 设置左上角的窗口图标接下来通过调色板控件接下来self.frame.move(260, 110) # 坐标为了简单方便，只设置了账号密码两个输入框以及登录注册两个按钮，如下为self.nameEd1 = QLineEdit(self) # 创建输入框。

参与评论您还未登录，请先登录后发表或查看评论

【实例】Python爬取CSND课程名

Kevin's Blog

05-08

442

爬取优快云人工智能课程名 1.导入urllib&re模块 import urllib.request,re 2.定义目标url变量 csdn_url=”https://edu.youkuaiyun.com/courses/o5329/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD” 3.探寻目标规律》》查看网页源代码》》ctrl+f 搜索关键字 ...

【每日爬虫】：利用线程池爬取2万张装修效果图

金鞍少年的博客

04-08

696

文章目录一、前言二、需求三、技术路线四、线程池爬取2万张装修效果图五、其他一、前言 2020-04-08日爬虫练习每日一个爬虫小练习，学习爬虫的记得关注哦！学习编程就像学习骑自行车一样，对新手来说最重要的是持之以恒的练习。在《汲取地下水》这一章节中看见的一句话：“别担心自己的才华或能力不足。持之以恒地练习，才华便会有所增长”，现在想来，真是如此。二、需求具体参考我昨日爬虫：【每...

python（第一章学习计划）

姥姥家的饭

02-26

1408

目标：熟悉 Python 语法，打好基础，完成简单程序编写。目标：掌握 Python 核心技能，具备独立开发能力。目标：掌握网络爬虫技术，能独立完成数据抓取任务。目标：成为 Python 高手，参与实际开发。目标：通过实战项目提升综合能力。

Python程序设计大作业报告（合肥工业大学 2023级）

Dulecam的博客

02-11

1070

Python程序设计课程大作业 Bilibili实时热榜GUI(Tkinter)程序完整报告合肥工业大学 2023级

Python零基础速成指南：12周从小白到项目实战

2401_87975790的博客

09-06

954

本文为Python学习计划，分为4个阶段：1.环境搭建与基础语法(1-4周)：安装Python、IDE，学习变量、流程控制、数据结构等核心语法；2.函数与面向对象(5-7周)：掌握函数定义、参数传递及面向对象编程；3.进阶应用(8-12周)：学习文件操作、异常处理、常用模块及数据分析库；4.项目实践：完成爬虫、数据处理或Web开发等小项目。建议每天1小时学习+2小时实践，利用交互式环境快速验证，善用pip管理第三方库。学习过程中可参考推荐视频、书籍和在线平台，保持动手实践。

三个月速成Python数据分析（每日实操版）

weixin_47362565的博客

05-30

1037

Python 基础（7 天，每天 2 小时）：学习 Python 语言基础，包括变量、数据类型、运算符、流程控制语句（if、for、while），以及列表、字典、元组等序列操作，可通过在线课程或 Python 基础书籍学习，同时每天编写一些简单的代码示例。可通过观看 Excel 教学视频并结合实际案例练习来学习。综合项目实战（2 天，每天 2 小时）：选择一个完整的数据分析项目，综合运用所学的 Python 知识和技能，从数据获取、预处理、分析到建模和可视化，完成整个项目，并撰写项目报告，总结经验和成果。

【python】速通笔记

没有手牌的博客

04-04

850

每天学习2-3小时，坚持项目实践，1个月后你将掌握Python实际开发能力！

Python编程入门：100天学习计划

《100_days_of_Python: Python的100天》是一个面向初学者系统化学习Python编程语言的完整学习路径项目，旨在通过为期100天的循序渐进式训练，帮助学习者从零基础掌握Python的核心语法、编程思想以及实际应用能力。...

100天掌握Python编程：从入门到实战

该项目源自2021年完整的《Python Pro新手训练营》课程，由知名编程教育者余慧玲（Angela Yu）设计并讲授。Angela Yu是全球范围内广受认可的技术讲师，其课程以结构清晰、内容详实、注重实践著称，尤其适合没有编程...

Python在机器学习中的模型训练

2509_93937153的博客

11-26

177

上周对比SVM和随机森林时，用Pipeline把预处理和训练步骤串起来，cross_val_score直接出十折交叉验证结果，整个实验可复现性极高。数据预处理这块绝对是重头戏。最近在做回归项目，r2_score和mean_squared_error这几个指标函数随调随用，省去了自己实现的麻烦。但平心而论，在常规业务场景下，从数据探索到模型上线的整个生命周期，Python的生态链确实做到了无缝衔接。很多库的默认参数就够用，想要精细调控又能深入底层，这种灵活性才是我们坚持用Python搞机器学习的根本原因。

Java总结进阶之路（基础二）

2509_94006474的博客

11-24

753

提示：java总结学习之路。

Python自动化测试框架开发

最新发布

2509_93945719的博客

11-26

322

封装requests时踩过坑，最初简单包装成通用方法，后来发现不同模块需要不同的超时策略和重试机制。框架开发过程中最大的体会是：好的设计不是一次性完成的，而是在不断踩坑、重构中迭代出来的。记住，自动化测试的终极目标不是追求100%覆盖率，而是用最小成本快速发现质量问题。最直观的变化是测试周期从原来的3天缩短到8小时，版本发布再也不用全员熬夜了。pytest的夹具机制比unittest灵活太多，特别是parametrize参数化，能轻松实现数据驱动。决定动手搭个统一的测试框架，把乱七八糟的脚本规范起来。

15：00开始面试，15：06就出来了，问的问题有点变态。。。

2301_78843735的博客

11-24

574

【摘要】本文分享了一位软件测试工程师的求职经历和面试经验。文章首先描述了作者遭遇降薪后寻求新工作的过程，并反思了在面试中因基础知识不足而失利的情况。随后系统整理了软件测试岗位的常见面试知识点，涵盖16个技术栈：包括测试理论、Linux、MySQL、Web/API/App测试、Python基础、性能测试等核心内容。其中详细列举了各技术栈的高频面试题，如测试步骤设计、Linux命令使用、Python编程题、MySQL优化等。最后提到完整的面试宝典包含近200页内容，旨在帮助求职者高效准备面试，提升通过率。

收藏！软件测试面试题

2401_86705770的博客

11-26

210

作为一位过来人也是希望大家少走一些弯路，如果你不想再体验一次学习时找不到资料，没人解答问题，坚持几天便放弃的感受的话，在这里我给大家分享一些自动化测试的学习资源，希望能给你前进的路上带来帮助。

Python全栈开发项目——AI智能聊天机器人

qiao_yue的博客

11-24

796

本项目实现了AI聊天功能，具有语音输入和聊天背景自定义等亮点功能

基于Python与Go构建云原生微服务自动化运维平台的架构设计思路实践策略与性能优化方法全流程解析

2501_94114213的博客

11-26

322

Python 提供灵活的任务调度与编排能力，Go 提供高并发、高吞吐的任务执行与采集能力。两者结合构建的云原生微服务运维平台能够在大规模环境下实现：自动化高可靠弹性扩展可观测高性能随着企业上云进程加速，Python + Go 的混合运维平台将成为云原生运维的标准实践方案。

Python在云原生微服务监控与自动化运维平台中日志处理与告警实践

2501_94182049的博客

11-23

622

开发效率高：快速实现日志解析、指标聚合和告警逻辑生态丰富：支持 Kafka、Prometheus、ElasticSearch、Celery 等易扩展与维护：模块化、异步、插件化设计性能优化灵活：批量、异步、缓存、序列化优化通过异步日志处理、实时指标聚合、告警策略和自动化运维集成，Python 能够支撑高并发云原生服务的监控需求，实现低延迟、高吞吐、可监控、可扩展的运维平台，为企业稳定运营和快速响应提供保障。