Python爬虫教程001:爬虫介绍

1、爬虫介绍

1.1、什么是互联网爬虫

  • 通过一个程序,根据url进行爬取网页,获取游泳信息
  • 通过程序模拟浏览器,去向服务器发起请求,获取响应信息

1.2、爬虫核心

  1. 爬取网页:爬取整个网页,包含了网页中所有内容
  2. 解析数据:将网页中得到的数据进行解析
  3. 难点:爬虫和反爬虫之间的博弈

1.3、爬虫用途

  • 数据分析/人工数据集
  • 社交软件冷启动
  • 舆情监控
  • 竞争对手监控

1.4、爬虫分类

1.4.1 通用爬虫

  • 实例
    • 百度、360、google、sougo等搜索引擎
  • 功能
    • 访问网页->抓取数据

**注意:**通用爬虫不是我们关注的重点。

1.4.2 聚焦爬虫

  • 功能
    • 根据需求,实现爬虫程序,抓取需要的数据
  • 设计思路
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

文理棵

你的鼓励将是我最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值