自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 python 自动化数据提取之正则表达式_python 正则提取数字

如下案例:有一个字符串s,我们需要在字符串中匹配3个以上的数字,字符串中数字有8个,贪婪模式会尽可能匹配更多字符,3个以上,8个也是3个以上,那么这里匹配的结果就是8个数字。re.match尝试从字符串的起始位置匹配一个模式,匹配成功 返回的是一个匹配对象(这个对象包含了我们匹配的信息),如果不是起始位置匹配成功的话,match()返回的就是空。而re.search匹配整个字符串,直到找到一个匹配成功的则进行返回,如果整个字符串中都没有找到匹配成功的,则返回空。“,”+“,”",后面加上?

2025-01-14 05:09:47 605

原创 python 爬虫基础教程-http headers详解_python http headers

当对这些网站的请求到来时,服务器根据Host这一行中的值来确定本次请求的是哪个具体的网站,就是域名解析。例如用手机访问谷歌和电脑访问是不一样的,这些是谷歌根据访问者的UA来判断的,这个应该所有接触爬虫不管不知道它什么意思都会用到它,因为如果没有它,大部分都会没反应。大家应该知道host是在http1-1之后才有的,也就是以前没有host只存在ip网站也是能够正常运行的,但是为什要加入host的呢。指定客户端能够接受的内容类型,在这唯一要提醒的就是它只是建议服务器,而并非就是你写成什么他就返回给你什么。

2025-01-14 05:06:06 900

原创 Python 操作 Excel,如何又快又好?_python打开读取excel最快的包

◈openpyxl - 既可以读文件、也可以写文件、也可以修改Excel文件;1.需求:读取test_api.xls文件中login工作表指定的单元格、指定行、或者所有的数据。1.需求:读取login.xls文件中指定的单元格、指定行、指定的列或者所有的数据。1.需求:对已存在的test_api.xlsx文件写入接口测试结果,如下图所示。1.需求:创建一个新的xls文件中写入如下数据,然后保存为login.xls。◈xlrd - 用于读取 Excel 文件,支持.xls和.xlsx格式。

2025-01-14 05:02:25 308

原创 ES实战--mapping

},“mappings”: {“properties”: {“date”: {“type”: “date”,“format”: “date_hour_minute”},“reviews”: {“type”: “integer”,“null_value”: 0},“attendees”: {“type”: “keyword”},“location_event”: {“properties”: {“name”: {“type”: “text”},“geolocation”:

2025-01-12 16:01:41 645 1

原创 ES6:【深扒】深入理解 JavaScript 中的异步编程

回调函数可以理解为一件想要去做的事情,由调用者定义好函数,交给执行者在某个时机去执行,把需要执行的操作放在函数里,将函数传入给执行者执行主要体现在,把任务的写在一个函数里面,等到重新执行这个任务的时候,直接调用那有人就会问了,第二段是指什么,我们再举一个例子,读取文件进行打印,这个操作肯定是异步的吧,那它怎么分两段呢?按照逻辑来分,第一段是读取文件,第二段是打印文件,可以理解为第一段是请求数据,第二段是打印数据阮老师的代码实例});在第一阶段执行结束后,会将结果返回给后面的函数,传入第二段。

2025-01-12 15:58:00 779

原创 ES(elasticsearch)搜索引擎安装和使用_es搜索引擎

Elasticsearch是一个基于Apache Lucene™的开源搜索引擎,无论在开源还是专有领域,Lucene可以被认为是迄今为止最先进、性能最好的、功能最全的搜索引擎库。但是,Lucene只是一个库。想要发挥其强大的作用,你需使用Java并要将其集成到你的应用中。Lucene非常复杂,你需要深入的了解检索相关知识来理解它是如何工作的。

2025-01-12 15:54:19 161

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除