爬虫的基本了解

1. 什么是爬虫?

爬虫,即网络爬虫,可以理解为在网络上爬行的一只蜘蛛,互联网就比作一张大网,而爬虫便是在这张网上爬来爬去的蜘蛛,如果它遇到资源,那么它就会抓取下来。想抓取什么?这个就由自己来控制。

比如它在抓取一个网页,在这个网中他发现了一条道路,其实就是指向网页的超链接,那么它就可以爬到另一张网上来获取数据。这样,整个连在一起的大网对这只蜘蛛来说触手可及,分分钟爬下来不是事儿。

网络爬虫(又被称为搜索引擎蜘蛛,网络机器人);

2. 浏览网页的过程

在用户浏览网页的过程中,我们可能会看到许多好看的图片,我们也可能会看到几张的图片以及百度搜索框,这个过程其实就是用户输入网址之后,经过DNS服务器,找到服务器主机,向服务器发出一个请求,服务器经过解析之后,发送给用户的浏览器HTMLJSCSS等文件,浏览器解析出来,用户便可以看到形形色色的图片了。

分析(如下)

www.baidu.com

本地host文件

本地路由

dns域名解析服务器

百度服务器

请求的页面

3. URL,即统一资源定位符,也就是我们说的网址,统一资源定位符是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它。

URL的格式由3部分组成:

(1)第一部分是协议(或称为服务方式)。

http://   https://  ftp://  file://

(2)第二部分是存有该资源的主机IP地址(有时也包括端口号)。

127.0.0.1   www.tanzhouedu.com

baidu.tk

顶级域名,一级域名,根域名:除了后缀以外只有一个点号

www.baidu.com 二级域名

com  baidu.com  cn  baidu.cn  shanfeng.club  com.cn  org.cn  baidu.com.cn

顶级域名:baidu.com  baidu.com.cn

二级域名:www.baidu.com  mp3.baidu.com

三级域名:a.b.baidu.com

302 资源临时重定向     301 资源重定向

权重   SEO:搜索引擎优化

爬虫  反爬就像“病毒 杀毒软件”

(3)第三部分是主机资源的具体地址,如目录和文件名等。

 

爬虫爬取数据时必须要有一个目标的URL才可以获取数据,因此,它是爬虫获取数据的基本依据,准确理解它的含义对爬虫学习有很大的帮助。

4. 爬虫的重要思想:

(1)理论上来讲只要是网页上面能够看到的数据都是可以爬取的(因为所有看到的网页上的数据都是由服务器发送到我们电脑上面的,只是有的数据加密过,很难解密)

(2)在网页上无法看到或者无法获取的数据,爬虫同样不可能拿到,比如一些付费资料

(3)分析页面数据的原则是从简到繁,从易到难

1)直接通过网页源代码获取

2)分析是否为ajax异步加载

3)数据是否被加密

 

内容概要:本文探讨了在MATLAB/SimuLink环境中进行三相STATCOM(静态同步补偿器)无功补偿的技术方法及其仿真过程。首先介绍了STATCOM作为无功功率补偿装置的工作原理,即通过调节交流电压的幅值和相位来实现对无功功率的有效管理。接着详细描述了在MATLAB/SimuLink平台下构建三相STATCOM仿真模型的具体步骤,包括创建新模型、添加电源和负载、搭建主电路、加入控制模块以及完成整个电路的连接。然后阐述了如何通过对STATCOM输出电压和电流的精确调控达到无功补偿的目的,并展示了具体的仿真结果分析方法,如读取仿真数据、提取关键参数、绘制无功功率变化曲线等。最后指出,这种技术可以显著提升电力系统的稳定性与电能质量,展望了STATCOM在未来的发展潜力。 适合人群:电气工程专业学生、从事电力系统相关工作的技术人员、希望深入了解无功补偿技术的研究人员。 使用场景及目标:适用于想要掌握MATLAB/SimuLink软件操作技能的人群,特别是那些专注于电力电子领域的从业者;旨在帮助他们学会建立复杂的电力系统仿真模型,以便更好地理解STATCOM的工作机制,进而优化实际项目中的无功补偿方案。 其他说明:文中提供的实例代码可以帮助读者直观地了解如何从零开始构建一个完整的三相STATCOM仿真环境,并通过图形化的方式展示无功补偿的效果,便于进一步的学习与研究。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值