想学爬虫但不会?那就先跟着我来学习下Python吧!

点击上方“AI派”,选择“设为星标
最新分享,第一时间送达! 640?wx_fmt=gif

作者:Tango,目前就职在一家对日开发的的IT服务公司。不是科班出身的我,出于对编程的热爱,自学了软件开发。从此深深陷入在代码的世界而无法自拔。

编辑:王老湿


爬虫专栏的介绍文章已经发布一周了(具体见:"王老湿,我。。我想学那个。。爬虫。可以嘛"),我们的这个专栏就是要带着大家使用Python来学习爬虫,所以第一篇先给大家简单介绍一些Python的基础知识。



 

Python环境安装

1. 官网地址:

    https://www.python.org/

2. Anaconda集成环境:

    https://www.anaconda.com/

本专栏推荐使用 Anaconda 这个环境

注意点


安装成功后,打开你的命令行工具,然后输入Python看看能得到什么?


640?wx_fmt=png


我这里没有使用windows系统自带的CMD,而是下载了一个叫做"cmder"的软件


如果你看到类似上图的界面,那么恭喜你,你已经学会了Python的50%。剩下的就是学习如何写代码了。

Python基础知识

1. Python代码层级

Python是用缩进(四个空格)来控制代码层级关系的。这点很重要。所以写在了最前面。


2.基本数据类型


Number(数值)



String(字符串)


字符串是用来表示文本的数据类型。比如:name = "路飞"。常见字符串操作如下:

name = "路飞"name[0] # 这个将返回‘路’
name[0# 这个将返回‘路’

640?wx_fmt=png

word = "人生苦短,我用Python"# 需要将苦短提取出来word[2:4]
# 需要将苦短提取出来
word[2:4]

640?wx_fmt=png

注意切片是包含左边,不包含右边的数值。

也可以从右边数

# 提取Pythonword[-6:]
word[-6:]

640?wx_fmt=png

name = "路飞"word = "人生苦短,我用Python"name + word
word = "人生苦短,我用Python"
name + word

640?wx_fmt=png

name = "路飞"msg = "你好啊,{}".format(name)
msg = "你好啊,{}".format(name)


640?wx_fmt=png

更多的用法,我们在实际代码中再为大家介绍。


List(列表)


python中用 [ ] 来表示列表

name_list = ['路飞', '索隆', '娜美']'索隆''娜美']


Dictionary(字典)


字典是值包含由键和值组成的数据集合

info = {'name':'路飞', 'age':18}'路飞''age':18}

要注意的是键不可以重复,而值是可以的。


Tuple(元组)


它和列表很相似,用()来表示。但是它一旦创建之后就不能修改了。

t = ('a', 'b')'b')


3.函数


函数的定义方式


def getInfo():    print("这是一个函数")
    print("这是一个函数")

我们可以通过def 加我们的函数名,来创建函数。


函数的调用


def getInfo():    print("这是一个函数")getInfo()
    print("这是一个函数")
getInfo()

640?wx_fmt=png


全局变量


640?wx_fmt=png

函数内是可以调用全局变量的,但是如果要修改那么就要加上global关键字。


640?wx_fmt=png


参数


函数是可以接收参数的


640?wx_fmt=png


这里的name就是参数,通常我们叫它“形参”


4.条件判断与循环


判断


640?wx_fmt=png


if 后面接的是表达式,接是否为真,为真的时候就会执行该语句的代码。如果为假的时候就会执行elif的判断或者else后面的判断。


循环


(1) for 循环


我们前面知道Python中有列表,那么我如果想变量列表中的所有元素该怎么操作呢?


640?wx_fmt=png


我们看到,列表里面的名字依次被打印了出来


(2) while循环


我们想让程序从从1开始数,数到10停止。


640?wx_fmt=png


while后面接的也是表达式,当条件满足时就会执行。

注意一定是一个可以结束的表达式,否则会进入死循环。这里的 i += 1,就是为了让i 每次都加1,这样当i 大于等于10的时候就不会再执行了。

5.类


这个概念比较抽象,简单的说就是用代码来描述一类事物。比如狗,猫,车这些。


在python中我们可以用class关键字来定义一个类

class Car():   '''    这是一个车的类   '''
   '''
    这是一个车的类
   '''

最后

我们这里只是简单的介绍了一下在爬虫中要用到的Python技术。由于篇幅的原因未能给大家讲的很细,希望大家见谅。之后会我将知识点放到实际爬虫项目中。欢迎大家跟着Tango继续后面的爬虫相关的内容。


此外,我们成立了这个爬虫专栏的读者交流群,扫描下方的微信二维码,添加微信好友,之后统一邀请你加入交流群。添加好友时一定要备注:爬虫。 

640?wx_fmt=jpeg





/ 今日赠送书籍 /


很幸运你能看到这里,以后每天王老湿会尽量在公众号头条的文章末尾增加今日赠送书籍的专区,每次赠送书籍为一本,也就是每天一本。获取方式为:混脸熟。


具体来说就是,我会在文章末尾增加一个问题,大家针对这个问题来进行留言,我会根据留言的用心程度以及脸熟程度来选出一个读者来赠送一本书籍,一般次日公布中奖者的名单,我会尽量保证让每一位混过脸熟的读者都能有书籍可以获得。


好了,来看下今天要赠送的这边书籍吧!


640?wx_fmt=jpeg


  内容介绍:

近几年,深度学习框架的快速发展大大降低了算法的入门门槛,越来越多的深度学习从业者能够通过这些框架实现算法并应用到生活场景中,让我们的生活更加智能和便捷。通过阅读本书,你将学到:

MXNet、TensorFlow、Pytorch、Caffe等深度学习框架的差异 

MXNet框架各主要模块的技术原理和应用实践 

MXNet在图像分类、目标检测、图像分割中的应用,以及相关算法的训练、模型测试和实现细节 

基于动态图构建网络结构的Gluon接口 

MXNet专门为计算机视觉任务推出的深度学习库GluonCV 

从零开始实现深度学习和计算机视觉算法的方法


作者简介:

魏凯峰,资深AI算法工程师和计算机视觉工程师,在MXNet、Pytorch、深度学习相关算法等方面有深入的研究和丰富的实践经验。目前就职于网易杭州研究院,从事计算机视觉算法相关的工作,主要研究方向包括目标检测、图像分类、图像对抗算法、模型加速和压缩。热衷于分享,坚持在Github上分享算法相关的代码,坚持在优快云上撰写算法相关的博客,累计百余篇,访问量过百万。


? ↑↑描上方二维码可购买

/ 今日留言主题 /

你是如何接触到Python这门语言的呢?


近期专栏推荐


1. 算法原理稳如狗,工程落地慌得很!AI炼丹炉实践指南来啦~

2. 从0到1,数据分析师修炼之路

3. "王老湿,我。。我想学那个。。爬虫。可以嘛"

640?wx_fmt=png


点下「在看」,给文章盖个戳吧! ?
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值