- 博客(816)
- 资源 (3)
- 收藏
- 关注
原创 python __init__文件的作用
执行main.py会报错:ImportError: cannot import name ‘x’ from ‘packageA’文件,目录也会被识别为包(称为 namespace package)。运行main.py时,什么都不会打印。从 Python 3.3 开始,即使没有。这样就可以在main.py中执行x了。(目前我们还没有建立)。
2025-04-04 13:53:48
128
原创 Elasticsearch7.17设置别名
设置别名我认为最重要的用处就是用户可以无感知的重建索引。有是有我们的索引结构不可能设置的很完美,比如keyword类型可能要修改为ik分词、新增加一些字段等等。通常的做法是通过reindex来完成,但是如果数据量非常大,那么需要消耗很长的时间。为了不影响用户使用业务,可以通过设置别名来完成。这样查询的时候可以通过。查询两个index。
2025-03-16 12:58:13
160
原创 快速搭建sentence_transformer方法
sentence transformer模型可以将句子进行Embedding。这里使用docker快速构建一个sentence transformer环境,小试牛刀。
2024-06-06 17:01:05
1040
原创 Elasticsearch reindex操作
test_1我想将的类型改为keyword,而且不想丢数据,因此使用Elasticsearch中的reindex来解决。
2024-05-27 11:45:09
441
原创 如何从requirements.txt文件中安装pytorch
平时使用文件来安装python但是如果我们的依赖中包含pytorch使用这个。
2024-04-25 17:39:00
567
3
原创 Elasticsearch克隆索引
我所使用的Elasticsearch的版本是基于7.17.7。需求是将某个ES的索引进行克隆。别名就可以搜到这个当前别名下的数据了。
2024-04-19 18:02:24
768
1
原创 Elasticsearch7.17.7操作geo_point类型数据
目前使用的elasticsearch版本是7.17.7其中location字段的类型设置为geo_point,可以传递经纬度。支持的数据格式如下,ES会自动将lon转化为经度,lat。
2024-03-02 17:16:12
746
原创 elasticsearch7.17.9两节点集群改为单节点
将数据从node-23-1节点中迁移到node-83-1节点。但是现在node-83-1并没有加入到集群中,因此首先将node-83-1加入到node-23-1的集群。
2024-01-03 09:54:03
1860
原创 Linux Shell脚本编程-花括号
主要是起到将集合内的项进行展开,将每一个项与外面的字符串进行组合。花括号可以定义一个集合,集合内可以定义多个可以枚举的项,每个项使用。
2023-05-19 14:20:36
460
1
原创 Linux Shell脚本编程-xargs命令
这样只会统计出文件的数量,明显不是我想要的,我需要的是统计文件行数。命令的作用,是将标准输入转为命令行参数。,这样就可以实现统计文件内容行数了。这三个文件内容的行数,通过。将文件名作为参数传递给。
2023-05-05 14:45:33
372
原创 Anaconda静默安装
包括设置 shell 以激活 conda。我们默认安装Anaconda时,需要进行交互才可以完成安装,例如需要输入。有时候我们只需要他进行默认安装即可,不需要进行交互。如果不想在启动时激活 conda 的基本环境,可以将。这样安装程序就不会做任何提示了,一路默认到底。
2023-04-06 15:34:43
1063
1
转载 vmware 共享文件夹hgfs没有显示
目录下(如果没有hgfs文件夹则创建,然后进入虚拟机挂载文件夹),然后执行。但是如果使用root用户就可以看到挂载的文件夹了。但是这并不是我们想要的。可以看到权限已经正常,非root下均可访问。但是有时候并不显示共享的文件夹。当完成共享文件夹之后,会出现在。
2023-01-06 16:48:57
5328
7
原创 vscode 离线安装ssh
然后输入ssh下载这两个插件:安装这两个插件:这样便在windows下安装成功了ssh。接下来需要在服务器端进行配置。首先查看windows上的vscode版本:这里的提交对应的就是版本号。打开服务器,在home需要将上面的ID改成vscode的版本号,下载得到。解压文件将里面的内容移动到下就可以了。这样就可以通过vscode远程连接了。
2022-12-13 17:38:34
2870
原创 Python正则表达式
还可以与其他字符进行组合:匹配除了a、b、c以外的字符。匹配到之间的任意一个字符,也可以代指除换行符以外任意一个字符匹配字母、数字、下划线或者汉字 匹配数字表示任意空白字符表示前一个字符出现0次或多次表示前一个字符出现1次或多次表示前面的字符出现0次或者1次表示前面的字符出现n次表示前面的字符出现n次或者大于n次重复次数是从n次到m次上面都是按照整体去匹配,如何匹配部分数据呢,这里可以使用分组的概念:可以
2022-11-29 12:30:29
1287
原创 安装textlive2022和texstudio
通过进入,点击,等待下载即可,也可选择其他版本。下载完成之后,使用windows自带的(不要用别的管理器,否则出现闪退现象)。点击进行安装。选择好安装位置之后就可以进行安装了。
2022-11-28 17:25:52
1498
原创 Python 内置模块
os.walk()主要用来扫描某个指定目录下所包含的子目录和文件。这篇文章将通过几个简单的例子来说明python中os.walk()的使用方法。上面的代码在扫描子目录和文件的时候,是采用自顶向下的方式进行扫描。可以理解为是深度优先进行遍历。假设我们的test文件夹有如下的目录结构,【可以在windows中通过。如果想要自底向上地扫描子目录和文件,可以添加上。命令来查看目录的文件结构】
2022-10-29 13:29:02
166
原创 Python 手动安装nltk数据包
自然语言处理工具包,是NLP研究领域常用的一个Python库。安装过程较为麻烦,这里记录一下。,然后移动到上面任意的一个文件夹。数据包,解压后,重命名为。
2022-10-17 17:40:26
2853
原创 critical package ctex error:ctex fontset“fandol“ is unavailable in current
原因是我在文章中使用了中文。解决方法如下,只需要在最上面添加。
2022-10-17 09:40:51
11782
4
转载 docker网络配置
Docker 在安装后自动提供 3 种网络,可以使用命令查看Docker 使用 Linux 桥接,在宿主机虚拟一个 Docker 容器网桥(docker0),Docker 启动一个容器时会根据 Docker 网桥的网段分配给容器一个 IP 地址,称为,同时 Docker 网桥是每个容器的默认网关。因为在同一宿主机内的容器都接入同一个网桥,这样容器之间就能够通过容器的直接通信。
2022-10-10 15:26:33
4098
1
原创 zotero自定义导出参考文献bib格式
这些字段,其实我们是不需要的。安装完成需要重启,重启之后,一直选。将中间那个框框写上你。所以我们选中一篇文献,使用。回到zotero的主页面,字段需要下载插件完成。就可以复制这篇文献的。
2022-09-23 20:51:40
9566
原创 anaconda 离线安装Python环境
在离线环境下,使用anaconda创建环境的时候,需要指定Python的版本,但是无法自动下载,需要手动下载Python包,然后用conda进行安装。
2022-08-17 13:57:40
18112
3
原创 Python 闭包与装饰器
当执行v1()时,inner()中的name会在自己的作用域中查找,因此name为rose。同理,执行v2()时,也会在自己的作用域中查找,因此name为rose。
2022-07-20 13:52:03
151
原创 python 参数内存地址相关、深拷贝与浅拷贝
我们需要知道的是当函数执行传参时,传递的是内存地址。验证:可以看出传递的是内存地址。因为和指向了同一块内存,所以的值发生了变化。例如:深拷贝如果想实现传值而不是传地址,那么可以使用深拷贝。函数的返回值也是内存地址上述代码的执行过程:所以,最终v1指向的函数内部创建的那块内存地址。如果两个函数进行调用,将返回不一样的内存地址:参数的默认值当我们在函数中定义了一个参数默认值之后,在函数定义之后,还未执行函数时,Python解释器会帮助我们为函数创建一块区域,存储参数的默认值。原理:Pyt
2022-07-01 12:33:26
800
原创 python 数据类型(整理)
类型转换:长整型:在python2中跟整数相关的数据类型有两种:int(整型)、long(长整型),他们都是整数只不过能表示的值范围不同。在python3中去除了long只剩下:int(整型),并且 int 长度不在限制。地板除:python2:布尔类型类型转化:整型转为布尔类型:只有转为布尔类型时结果为,其他情况都是其他类型转为布尔类型:只有内容为空的情况转为布尔类型时结果为,其他情况都是如果在 、 条件后面写一个值当做条件时,他会默认转换为布尔类型,然后再做条件判断。字符串判断字
2022-06-29 17:01:36
402
原创 python字符编码
编码,就是文字和二进制之间的一个对照表。最早计算机诞生之初,就产生的编码,ascii规定使用1个字节来表示字母与二进制的对应关系。例如:总共有28=2562^8=25628=256 个编码。对于一些语言是不够的。gb-2312编码,由国家信息标准委员会制作(1980年)。gbk编码,对gb2312进行扩展,包含了中日韩等文字(1995年)。在与二进制做对应关系时,由如下逻辑:unicode也被称为万国码,为全球的每个文字都分配了一个码位(二进制表示)。有两种表示方式:ucs4无论是ucs2
2022-06-29 14:26:45
349
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人