小李飞刀李寻欢
视频号:小明哥直播间
展开
-
从pb到tflite之二
上一篇博文尝试了很多转tflite的方法:1-bazel build 据说这种要下载TensorFlow源码,而非已经通过pip安装的库;2-tflite_convert/toco这俩是一样的,都是命令,可以在终端直接用,不过目前这种方法出现的错误不知道是啥原因,百思不得其解 ;3-其他通过代码直接转的方法,比如tf.contrib.lite.TocoConverter.from_frozen_g...原创 2019-09-18 21:09:29 · 1648 阅读 · 6 评论 -
es8实现向量检索与关键词匹配混合搜索
{"title": "自然语言处理", "content": "自然语言处理是计算机处理人类语言的技术"}{"title": "深度学习", "content": "深度学习是基于神经网络的机器学习方法"},{"title": "深度学习", "content": "深度学习是基于神经网络的机器学习方法"},{"title": "机器学习", "content": "机器学习是人工智能的一个分支"},{"title": "机器学习", "content": "机器学习是人工智能的一个分支"},原创 2025-04-03 16:18:11 · 72 阅读 · 0 评论 -
es 集群存储字典 json字段----python实现
在 Elasticsearch 中,你需要为索引定义一个映射,确保字段可以存储 JSON 格式的数据。通常,你可以使用。原创 2025-04-02 14:13:01 · 139 阅读 · 0 评论 -
Failed to initialize NVML: Driver/library version mismatchNVML library version: 570.124
sudo apt purge nvidia-* libnvidia-* # 清除所有 NVIDIA 驱动及库文件。,但系统中可能存在另一个版本的驱动库文件(如 570.124),导致版本冲突。:部分系统需禁用 Secure Boot 才能加载 NVIDIA 驱动。:若在 Docker 中报错,检查容器内驱动版本是否与宿主机一致。:系统中安装了多个版本的 NVIDIA 驱动,导致版本冲突。:系统内核升级后,NVIDIA 驱动未重新编译适配。:更新驱动后未重启系统,旧版本的内核模块仍在运行。原创 2025-03-28 11:09:06 · 112 阅读 · 0 评论 -
怎么确定NCCL能用了?
cuda 安装不了就直接:apt install nvidia-cuda-toolkit。然而还是出bug了,还是没有那个so文件。忘了,原文还有以下:类似的。四、安装nvcc即CUDA。原创 2025-03-27 17:58:03 · 309 阅读 · 0 评论 -
vllm serve 使用方法
是 vLLM 提供的命令行工具,用于快速部署兼容 OpenAI API 的 HTTP 服务器。是 vLLM 中简洁的命令行接口,用于快速启动 API 服务。指定模型路径或 Hugging Face Hub 模型名称(如。信任远程代码(加载需要自定义代码的模型,如某些社区模型)。张量并行 GPU 数量(多卡推理时设置为 GPU 数量)。SSL 私钥文件路径(启用 HTTPS)。确认模型路径正确(本地模型需绝对路径)禁用性能统计日志(减少日志输出)。禁用请求日志(减少日志输出)。GPU 显存利用率(默认。原创 2025-03-27 10:58:21 · 172 阅读 · 0 评论 -
vLLM命令行使用方法详解
建议根据硬件配置(GPU 型号、显存大小)逐步优化关键参数(如批处理大小和显存利用率)。vLLM 是一个针对大语言模型(LLMs)优化的高效推理和服务库。生成的最大 token 数量(上下文长度 + 生成长度需小于模型限制)。输入文件路径,支持格式:每行一个提示文本,或 JSON 列表(如。GPU 显存利用率(0~1,默认 0.9,调整以避免 OOM)。GPU 张量并行数量(多卡推理时设置为 GPU 数量)。加载需要自定义代码的模型(如某些社区模型)。生成随机性(0=确定性,1=高随机)。原创 2025-03-27 10:41:20 · 307 阅读 · 0 评论 -
speech input and to mp3语音输入为mp3
语音数据是个初级问题,是为后续处理的第一步,后续可能语音识别,降噪,声纹复刻等等。原创 2025-03-24 14:02:59 · 28 阅读 · 0 评论 -
ERROR: Failed building wheel for pyaudioFailed to build pyaudioERROR: ERROR: Failed to build insta
这个错误表明在编译pyaudio时缺少 PortAudio 开发库。原创 2025-03-24 11:36:02 · 128 阅读 · 0 评论 -
语音生成/语音复刻CosyVoice语音生成大模型2.0-0.5B
CosyVoice 2.0 是一款全新升级的多语言语音生成模型,相较于 1.0 版本,它在准确性、稳定性、速度和语音生成能力上都有显著提升。原创 2025-03-20 14:32:22 · 74 阅读 · 0 评论 -
Elasticsearch text字段检索方法
textvskeywordtext用于分词搜索,keyword用于精确值(如聚合、过滤)。子字段.keyword:Elasticsearch 自动为text字段生成(无需额外配置)。性能优化:在filter中使用term或terms避免评分开销。根据需求选择合适的查询类型!原创 2025-03-19 15:45:59 · 183 阅读 · 0 评论 -
linux 安装包方式安装ffmpeg,并在环境中设定或指定ffmpeg地址
在 Linux 系统中,以安装包的方式安装 FFmpeg 并设定其环境变量可以按照以下步骤操作。以下步骤以 Ubuntu 系统为例,其他 Linux 发行版步骤会稍有不同。原创 2025-03-17 14:47:03 · 255 阅读 · 0 评论 -
基本登录页面功能实现
登录容器:使用 < div class=“login-container”> 作为登录表单的容器,包含标题 < h2>、表单 < form> 和错误提示 < div id=“error-message”>。全局样式:设置 box-sizing 为 border-box,确保所有元素的宽度和高度包含内边距和边框。整体结构:使用 < html>、< head> 和 < body> 标签构建基本的 HTML 结构。登录容器样式:设置登录容器的背景颜色、圆角、阴影和动画效果,使其具有立体感和动画过渡。原创 2025-03-08 22:29:40 · 103 阅读 · 0 评论 -
Milvus JSON数据存储优化方案
无论是json数据还是string/varchar 类型数据,其长度都不能超过65536,这是根本,不像ES的text类型数据一样,可以无限长。类型,则无需通过编码或分块即可直接存储二进制数据。(例如 128 位的二进制哈希值),而非通用二进制数据(如文件、压缩流等)。:用于表示二进制向量(如哈希、二进制量化后的特征),不能存储任意二进制数据。:只能通过向量相似度搜索访问,无法直接按二进制内容检索。将二进制数据转换为 Base64 字符串,存入。是唯一直接支持二进制数据的类型,但它。原创 2025-03-06 21:24:11 · 160 阅读 · 0 评论 -
style-your-video风格化你的视频
视频风格化是指将视频内容转换为特定艺术风格(如油画、水彩、卡通等)的技术。将视频拆解为单帧图像,对每帧应用图像风格迁移算法,最后重新合成视频。通过光流(Optical Flow)或时序约束保持帧间连贯性。# 模型代码需自行实现或从开源库获取,此处为伪代码。# 加载预训练风格迁移模型(示例:AdaIN)# 伪代码:使用RAFT计算光流并约束相邻帧。frame1 = ... # 当前帧。frame2 = ... # 下一帧。# 在风格迁移损失函数中加入光流约束。使用更快的风格迁移模型(如。原创 2025-03-06 11:51:51 · 342 阅读 · 0 评论 -
style-your-face风格化你的脸
环境准备:安装必要的库,如 PyTorch、torchvision、opencv-python 等。数据准备:准备人脸图像数据。模型加载:加载预训练的风格化模型。图像预处理:对输入的人脸图像进行预处理,使其符合模型输入要求。风格化处理:将预处理后的图像输入模型,得到风格化后的图像。结果可视化:显示或保存风格化后的图像。原创 2025-03-06 11:43:04 · 384 阅读 · 0 评论 -
es如何进行refresh?
在 Elasticsearch 中,refresh操作的作用是让最近写入的数据可以被搜索到。以下为你介绍几种常见的执行refresh。原创 2025-03-05 13:07:48 · 490 阅读 · 0 评论 -
conda 创建的Python环境如何迁移到另一台没有网络的服务器上?
确保原机器与目标服务器的操作系统和架构(如Linux/macOS/Windows、64位)一致。# 输出示例:/home/user/anaconda3/envs/myenv。# 解压到 Conda 环境目录(例如 ~/anaconda3/envs/)通过上述任一方法,即可在无网络环境中迁移Conda环境。:将整个环境目录打包成压缩文件,迁移后直接解压使用,无需网络依赖。:直接复制Conda环境文件夹到目标服务器,手动激活。# 导出环境包列表(假设环境名为 myenv)# 创建环境(指定离线包路径)原创 2025-03-05 10:26:39 · 270 阅读 · 0 评论 -
es检索elasticsearch检索curl实现
在 Elasticsearch(ES)集群中进行搜索时,你可以使用不同的搜索方式,下面为你介绍几种常见搜索场景下的请求体(body)数据示例。假设你使用的是 Elasticsearch 的 RESTful API,并且通过 HTTP 请求来执行搜索操作。原创 2025-03-04 12:19:47 · 197 阅读 · 0 评论 -
ES检索elasticsearch实现python库方法
【代码】ES检索elasticsearch实现python库方法。原创 2025-03-04 12:17:37 · 269 阅读 · 0 评论 -
如何将一台服务器的pip环境迁移到另一个机器?
在没有网络的情况下,将一台服务器的pip。原创 2025-03-03 21:19:03 · 226 阅读 · 0 评论 -
ES 删除index 的curl
**权限**:执行删除操作需要有足够的权限。如果 Elasticsearch 配置了安全插件,可能需要提供用户名和密码。- **不可逆**:删除操作是不可逆的,删除后索引及其数据将无法恢复。在执行删除操作之前,请确保已经备份了重要数据。- `<node-ip|hostname>`:Elasticsearch 节点的 IP 地址或主机名。- **集群环境**:在集群环境中,删除索引的操作会广播到所有节点。- `<index-name>`:要删除的索引名称。原创 2025-02-27 10:23:53 · 226 阅读 · 0 评论 -
bootstrap check failure [1] of [1]: max virtual memory areas vm.max_map_count [65530] is too low, in
是一个 Linux 内核参数,用于控制一个进程可以拥有的最大内存映射区域数量。Elasticsearch 使用内存映射(mmap)来高效地访问索引文件,因此需要较高的。根据你的日志信息,Elasticsearch 在启动时遇到了一个关键问题,导致它无法正常运行。如果你使用的是 Ansible 或其他配置管理工具,可以通过。参数后,需要确保更改生效。在某些系统中,你可以创建一个专门的配置文件来设置。如果你希望更改在系统启动时自动生效,可以编辑。为了使更改永久生效,你需要编辑。为了使更改永久生效,你需要编辑。原创 2025-02-26 10:39:53 · 65 阅读 · 0 评论 -
ssh 带端口登录的命令
在使用 SSH(Secure Shell)连接到远程服务器时,如果服务器使用了非默认端口(默认端口为22),可以通过在命令中指定端口号来完成登录。SSH 带端口登录的基本命令格式如下:bash复制。原创 2025-02-25 10:48:15 · 118 阅读 · 0 评论 -
有密钥对登录服务器的怎么采用scp传文件
使用密钥对登录服务器时,可以通过scp命令安全地传输文件。以下是使用密钥对进行scp。原创 2025-02-25 10:35:03 · 258 阅读 · 0 评论 -
Es集群开机重启的设置
bin/bash# 检查 Elasticsearch 是否运行,如果未运行则启动if!thenficrontab -e# 添加以下内容,每分钟检查一次虽然 Elasticsearch 本身没有“开机重启”的设置,但可以通过以下方式实现类似功能:使用systemd服务管理工具(适用于 Linux 系统)。使用 Docker 的restart策略(适用于容器化部署)。使用 Kubernetes 的(适用于集群化部署)。编写自定义脚本并结合定时任务。根据你的部署环境选择合适的方式即可。原创 2025-02-24 15:00:49 · 205 阅读 · 0 评论 -
Elasticsearch 中 content 字段的值超过了 32766 字节的默认最大长度限制该咋办?
如果需要存储大段文本且不需要精确匹配,建议将字段类型改为text。如果需要精确匹配和全文检索,可以使用多字段映射。如果字段内容长度偶尔超过限制,可以使用参数。如果字段内容长度经常超过限制,建议重新设计数据模型,例如分割字段内容。根据实际需求选择合适的解决方案。原创 2025-02-24 13:58:12 · 191 阅读 · 0 评论 -
es8-elasticsearch 写入数据与检索
从 Elasticsearch 6.x 开始,文档类型逐渐被废弃,到 8.x 版本时,文档类型已经完全移除。你可以直接将数据写入到索引中,并在查询时直接对索引进行操作。如果你之前使用的是旧版本的 Elasticsearch,并且依赖于文档类型,建议在迁移到 8.x 时重新设计数据模型以适应新的无类型架构。Elasticsearch 已经移除了对文档类型的强制要求,所有文档直接存储在索引中,不再需要指定类型。在 Elasticsearch 8.x 中,你只需指定索引名称,而不需要指定文档类型。原创 2025-02-20 15:54:36 · 395 阅读 · 0 评论 -
es-elasticsearch 一些记录
如果之前 systemctl enable firewalld过,就还需要systemctl disable firewalld,关闭开机自启动。不要设置上述防火墙。jvm文件(顶格写,不要空格)原创 2025-02-20 15:31:01 · 219 阅读 · 0 评论 -
deepseek R1大模型蒸馏专业领域模型(3)
定义一个带有蒸馏损失的自定义模型,继承自T5ForConditionalGeneration,这样可以利用现有的结构,同时添加蒸馏相关的层和损失计算。\n\n训练部分,我会设置一个Trainer,使用适合的训练参数,如学习率、批次大小和训练轮数。\n\n评估部分,使用BLEU分数来衡量生成文本的质量,这可以通过一个自定义的计算BLEU分数的方法实现。\n\n总的来说,我需要提供一个结构清、易于理解和修改的代码示例,帮助用户快速上手法律领域的模型蒸,同时考虑到他们可能的技术背景和潜在需求。原创 2025-02-08 10:33:35 · 46 阅读 · 0 评论 -
deepseek R1大模型蒸馏专业领域模型(2)
n\n---\n\n### **步骤说明**\n1. **数据准备**:准备法律领域的文本数据(如合同条款、法律文书等),并标注类别(如合同类型、法律条款分类等)。\n2. **加载预训练模型**:加载通用的大模型(如BERT)作为教师模型。\n3. **定义学生模型**:选择一个较小的模型(如DistilBERT)作为学生模型。\n4. **蒸馏训练**:通过知识蒸馏技术,将教师模型的知识迁移到学生模型。\n5. **模型评估**:在法律领域数据上评估学生模型的性能。实际应用时需根据数据和任务调整。原创 2025-02-08 10:21:48 · 59 阅读 · 0 评论 -
deepseek R1大模型蒸馏专业领域模型(1)
方案2:要将一个通用的大模型(如DeepSeek R1)蒸馏成一个专注于法律领域的模型,通常需要以下步骤:数据准备、模型微调、知识蒸馏和评估。以下是一个简化的代码示例,展示了如何使用Hugging Face的`transformers`库来实现这一过程。方案1:以下是一个基于PyTorch和Hugging Face Transformers库的法律领域模型蒸馏的简化代码示例。原创 2025-02-08 10:09:45 · 276 阅读 · 0 评论 -
docker启动服务占用172.18网段怎么改成其他网段?和网桥有关吗?或者怎么改docker-compose启动用的yml文件
如果你使用启动服务,可以在中自定义网络,指定所需的网段。修改 Docker 默认网桥的网段可以通过编辑并设置bip实现。在中可以通过自定义网络并指定subnet来使用其他网段。这些操作与 Docker 网桥有关,修改后需重启 Docker 或重新启动服务。通过这些步骤,你可以将 Docker 服务的网段从172.18改为其他网段。原创 2025-01-22 16:13:58 · 774 阅读 · 0 评论 -
WARN[0000] a network with name milvus exists but was not created for project “milvus“.Set `external
如果网络已经存在,添加配置。如果网络不存在,让 Docker Compose 自动创建网络。使用检查现有网络。原创 2025-01-22 11:42:59 · 72 阅读 · 0 评论 -
docker重启的方法
docker restart <容器名称或容器ID>重启 Docker 服务:根据操作系统使用相应的命令docker-compose安装启动,方法。wget https://github.com/milvus-io/milvus/releases/download/v2.0.2/milvus-cluster-docker-compose.yml-优快云博客。原创 2025-01-21 10:18:36 · 3852 阅读 · 0 评论 -
python milvus及curl命令进行query请求
代码如下:limit=3curl命令;-d '{}'curl命令2:-d '{"data": [],"limit": 3}'原创 2025-01-20 17:55:34 · 296 阅读 · 0 评论 -
k8s 环境配置netplan apply
k8s 环境配置原来内容:network:version: 2ethernets:eth0:match:mtu: 0。原创 2025-01-15 17:19:11 · 57 阅读 · 0 评论 -
ImportError: cannot import name ‘Literal‘ from ‘typing‘
Literal 是在 Python 3.8 中引入的,因此在 Python 3.7 中直接导入会引发 ImportError。2. 使用 typing_extensions 包: 安装 typing_extensions 包,它提供了对新类型提示的向后兼容性支持。1. 升级 Python 版本: 升级到 Python 3.8 或更高版本,这样可以直接使用 Literal。背景:py37版本引入报错,据说是38版本才有的,因而报错,需要安装扩展包才能解决。确保你的代码在修改后能够正常运行,不再出现导入错误。原创 2024-10-25 15:23:44 · 975 阅读 · 0 评论 -
中英文字符串判断(2)
`re.findall(r'[\u4e00-\u9fa5]', content)` 返回字符串中所有中文字符的列表,`len()` 函数计算列表的长度,即中文字符的数量。- `re.findall(r'[a-zA-Z]', content)` 返回字符串中所有英文字母的列表,`len()` 函数计算列表的长度,即英文字符的数量。print(is_english_or_chinese(content3)) # 输出: Mixed (English and Chinese)原创 2024-10-10 13:59:22 · 333 阅读 · 0 评论 -
判断content字段是否是英文的方法
如果字符串既不是纯英文也不是纯中文,返回 `"Neither English nor Chinese"`。- `[a-zA-Z\s]` 表示匹配任意英文字母(大小写)或空白字符(空格、制表符等)。- `[\u4e00-\u9fa5]` 表示匹配任意中文字符。- 如果字符串是纯英文,返回 `"English"`。- 如果字符串是纯中文,返回 `"Chinese"`。- `^` 和 `$` 分别表示字符串的开始和结束。- `+` 表示前面的字符可以出现一次或多次。- `\s` 表示匹配空白字符。原创 2024-10-10 11:13:20 · 106 阅读 · 0 评论