
爬虫
文章平均质量分 90
爬虫是指一种自动化程序,用于在互联网上抓取和收集特定网站或网页的信息。这些程序可以按照预先设定的规则和算法,自动地浏览网页并提取所需的数据,例如文本、图片、视频等。爬虫在搜索引擎、数据挖掘、市场调研等领域有着广泛的应用。然而,爬虫也可能会对网站的服务器造成负担,因此在使用爬虫时需要遵守网站的使用规定
桃花坞生动的芒果
这个作者很懒,什么都没留下…
展开
-
职场必备技能1学会自动化办公&用代码写到word文档里
1、文档必须是关闭的,否则保存,因为权限不够2、 #https://www.biqg.cc发链接要加上域名否则无效报错# 拿简介# 拿到小说的标题---是文本# 放入到文档中# 让简介加粗---分批加add_runp.add_run('简介:\n').bold = True拿小说目录和章节与正文正文# 拿目录---正文链接# 拿到对应的正文链接# 发起请求,发到正文中,拿到响应对象text_html# https://www.biqg.cc发链接要加上域名否则无效报错。原创 2023-12-28 01:09:43 · 1432 阅读 · 1 评论 -
职场必备技能2自动化办公excel操作
Excel是一种电子表格软件,由微软公司开发和发布。它是一种用于数据分析、计算和管理的工具,可以用于创建、编辑和组织数据表格,进行数据分析和图表制作等。Excel具有强大的计算功能和丰富的数据处理功能,被广泛应用于商业、金融、教育、科研等领域。Excel的文件格式为.xlsx,它可以在Windows、Mac和其他操作系统上运行。excel有不同的sheet页,每个sheet页,也有不同的内容 先获得对应的sheet页。原创 2024-01-08 23:43:27 · 1369 阅读 · 0 评论 -
一键了解获取网页requests方式
代码发起请求 获取到请求的网页的源码,从源码里面筛选内容。原创 2024-01-07 18:50:31 · 825 阅读 · 1 评论 -
一语道破爬虫,来揭开爬虫面纱
网络蜘蛛:互联网是张网,可以在网上走来走去网络爬虫就是自动的从网络上获取数据的程序【模拟客户端浏览器】好吃:有数据才能进行数据分析【大数据分析】能从网络上爬取什么:浏览网站时所能看见的数据都可以通过爬虫程序保存下来、文字、图片、视频/音频数据展示----------将爬取的数据展示到网页或者APP上,比如:百度新闻、今日头条,数据分析-----------从数据中寻找一些规律,比如:慢慢买(价格对比)、TIOBE排行等网络爬虫的约束---------Robots协议、约束网络爬虫程序的速度(一秒发出一千个请原创 2023-12-29 12:37:02 · 2571 阅读 · 1 评论