Python爬虫是什么?

 一、爬虫的概念和作用

1.1 概念:

        网络爬虫也叫网络蜘蛛,特指一类自动批量下载网络资源的程序,这是一个比较口语化的定义。更加专业和全面对的定义是:网络爬虫是伪装成客户端与服务端进行数据交互的程序.

1.2 作用

1.2.1 数据采集

        大数据时代来临,数据就是核心,数据就是生产力,越来越多的企业开始注重收集用户数据;而爬虫技术是收集数据的—种重要手段。

1.2.2 搜索引擎

        百度,谷歌等搜索引擎都是基于爬虫技术。

1.2.3 模拟操作

        爬虫也被广泛用于模拟用户操作,测试机器人,灌水机器人等。

二、爬虫原理

        伪装成服务端与客户端交互

2.1 网络架构(客户端和服务端)

        (1) c/s 即client server客户端服务端

        (2) b/s即 browser server浏览器服务端

        (3) m/s 即 mobile server移动端服务端
        互联网的飞速发展是商业经济推动的。目前几乎所有的商业应用都是基于互联网的,它们一般采用c/s架构b/s架构或者m/s架构

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值