1–网络爬虫—其实就是一中程序,它主要应用与搜索引擎。
2–它将一个网站的所有内容与链接进行阅读,并建立相关的全文索引
,然后,将这些索引存储导数据库中,然后在跳到另一个网站.它的
样子从宏观上看,就一只很大的蜘蛛
3–当人们在网络上搜索关键字时,如google,baidu等,其实就是将你
所输入的,你所要查找的内容与数据库中的内容进行匹配(比如数据
库中的—模糊匹配,精确匹配等等),然后找出与用户相符的结果。
4–网络爬虫程序的质量—决定了一个搜索引擎的搜索能力的高低,比如
google的搜索引擎明显要比百度好,就是因为他的网络爬虫程序高效,
编程的结构好
网络爬虫介绍
最新推荐文章于 2023-12-11 21:08:50 发布
