爬虫速成之行-启航

本文介绍了作者在准备大数据竞赛时,决定通过10天特训学习Python爬虫。主要涵盖了Python基础知识,包括开发环境Pycharm、条件和循环、常用数据结构如字符串、列表、元组和字典,以及函数、文件操作和异常处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言

今年的教师节注定是不平凡的。我突然被领导通知要参加一个比赛,在9月23日开始,是关于大数据的。参赛资料显示,其主要考察内容是使用爬虫获取数据,并进行可视化。作为一名Oracle DBA,我当然知道这些知识大量命中了我的知识盲区。本着“数据工程师应该自己搞定数据”这个原则,我决定来针对自己来一个10天特训,对Python爬虫进行速成。

知识结构

相信做DBA的朋友和我有一样的困扰,为什么开发弟兄们总是很少考虑底层数据库的设计和SQL的质量呢?领导为啥老帮开发弟兄说话呢?到底为啥总是“得开发者得天下”?这次速成计划我得以好好以开发视角来看待项目。现将爬虫技术需要的最小化知识整理一下,大致分为Python基础,爬虫相关程序包,可视化工具FLASK。今天先介绍Python基础

Python基础

这一块我将列出Python爬虫所需要掌握的最小化Python知识。

开发环境

这里建议使用Pycharm,高效的自动排版,语法高量,命令补全,连我这个完全没有接触过开发的新手,都能很快上手。

条件和循环

条件判断主要包括if语句,主要有if嵌套和if else。

循环主要有while和for循环

常用数据结构

字符串

项目中需要大量处理文本,判断文本。

列表

表示方式为[]

爬虫工具中获取的数据大都存储在列表当中;

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值