- 博客(467)
- 资源 (35)
- 问答 (1)
- 收藏
- 关注
原创 智能语义搜索核心算法:全链路技术解析与工程实践,将rag向量检索准确率提升到98%以上……
智能语义搜索算法全链路解析 本文系统性地介绍了一套面向数据查询的智能语义搜索算法,从数据准备到检索执行完整链路。该算法采用"数据准备为基础、智能语义搜索为核心、动态学习为迭代动力"的设计理念,包含数据准备层和检索执行层两大核心架构。 数据准备层通过构建向量库、领域词典、数据特征和关联关系,为检索提供高质量输入。检索执行层采用四步核心流程:1)查询扩展,通过同义词扩展提升召回率;2)向量生成与搜索,将文本意图转化为高维向量进行高效召回;3)智能重排序,基于多维度相关性得分提升精准率;4)动
2025-10-18 11:54:33
184
原创 知识库检索过程中,rag主要存在的问题,核心解决方法见文末图
本文系统分析了RAG向量库检索全链路中的核心问题:1)数据与向量表示层存在源数据质量差、语义理解不足和多模态支持弱等问题;2)检索算法层面临相似性计算偏差、召回与精度平衡困难及数据更新滞后等挑战;3)场景适配层问题包括长文本拆分不合理、上下文窗口限制及领域适配不足;4)工程实施层存在大规模检索效率低、资源消耗高等落地障碍。文章最后提出可提供详细的RAG问题排查清单,帮助用户针对性优化各环节。
2025-10-18 11:19:14
57
原创 bat文件一建自动创建数据库,启动数据库服务,修改数据库密码,导入数据
本文介绍了一个绿色版MySQL数据库的自动化导入脚本系统。该批处理脚本(import_dl_sql.bat)能够自动完成MySQL的初始化、密码管理、数据库创建和SQL脚本导入全过程。系统包含mysql绿色版目录(含bin执行文件和配置文件)和SQL脚本文件。脚本功能包括:检测MySQL环境、首次初始化数据库、启动服务、密码验证与重置、数据库创建、SQL脚本导入以及服务关闭等完整流程,实现了绿色版MySQL的一键式部署与数据导入。
2025-09-24 22:48:10
138
原创 如何将数据库快速接入大模型实现智能问数,实现chatbi、dataagent,只需短短几步,不需要配置工作流!
智能问数系统提供全流程数据决策解决方案,通过三步完成初始化:1)创建管理员账号;2)配置AI模型参数;3)确认系统初始化。该系统实现自然语言交互分析,支持多层级用户需求,具备六大核心功能:智能语义理解、任务编排、NL2SQL转换、高速查询、可视化呈现和智能总结。典型应用成效包括:将分析时间从数小时缩短至分钟级,降低90%技术门槛,支持20+图表类型输出。系统支持灵活部署方案,可无缝对接现有业务系统,显著提升企业数据决策效率。
2025-08-16 13:04:49
501
原创 如何设计表结构以提高向量检索召回率
本文提出了向量库表结构设计方案,旨在提升检索召回率。核心包含文档内容表、向量数据表和可选文本分块表,支持存储原文、向量及分块信息。建议添加哈希索引、时间索引和IVFFlat/HNSW向量索引优化查询性能。扩展方案包括查询日志和模型版本表。实施建议强调分块处理、维度适配、索引选择、同步更新和内容去重机制。该设计为构建高效向量检索系统提供了完整的技术框架。
2025-05-27 09:20:49
477
原创 MCP调用示例说明,以百度地图为例
MCP服务服务端是由服务商提供好的调用代码,比如百度地图路线规划,原来是百度提供了接口,由开发人员自己写代码调用,现在通过本地部署百度提供的mcp服务,只需关系输入参数即可,服务调用由mcp服务端自己调用直接返回结果给mcp客户端。通过 MCP 协议,服务商可以提供预配置的 MCP 服务端,使得开发者可以更方便地调用其服务。
2025-04-18 11:34:35
880
原创 要不要使用mcp服务
比如我要做一个agent,可能会用到文件解析,长文本分词,向量化处理,语义化检索,数据库查询语句生成,图表生成,结果分析等。
2025-04-18 11:18:39
474
原创 手动创建自己的模型,实现意图识别
通过上述步骤,你可以构建一个能够识别用户意图(统计信息 vs 查询信息)的模型。,可以按照以下步骤设计和训练模型。将模型导出并部署为 API 服务。你需要收集一些用户输入的样本,并为每个样本标注意图类别。如果你没有现成的数据,可以手动创建或模拟一些样例。我们可以通过构建一个文本分类模型来完成这个任务。使用 Hugging Face 提供的。在测试集上运行模型,确保其泛化能力良好。要实现一个模型,能够识别用户输入是想。使用 Hugging Face 的。库对文本进行分词和编码。
2025-04-16 09:19:38
583
原创 从0创建一个模型的主要步骤
从零创建一个BERT模型需要深入理解Transformer架构和预训练任务的设计。通过以上步骤,可以构建一个基本的BERT模型,并在特定任务上进行训练和微调。
2025-04-16 09:13:40
565
原创 如何自己编写一个模型,基于模型微调
开发和训练一个自己的模型是一个复杂但非常有意义的过程。以下是详细的步骤,涵盖了从环境搭建到模型微调的全流程。以下场景中文自然语言处理(NLP)任务为例,比如意图识别或文本分类。使用 Hugging Face 提供的预训练模型(如。为例,假设你要构建一个能够识别用户意图的模型。在开始之前,明确你的任务目标非常重要。收集与任务相关的数据。
2025-04-16 09:05:20
690
原创 如何实现一个意图识别模型
在对话过程中识别用户需求是构建智能对话系统(如聊天机器人、虚拟助手等)的核心任务之一。为了实现这一目标,意图识别(Intent Recognition)和槽位填充(Slot Filling)通常是两个关键步骤。对话管理模块负责维护对话状态,并根据用户意图和历史对话记录决定下一步的动作。意图识别和槽位填充可以看作是相关的任务,因此可以通过多任务学习的方式同时优化这两个任务。要实现高质量的意图识别,需要准备高质量的训练数据。意图识别的目的是理解用户的意图或目的。两者结合可以更好地理解用户的需求。
2025-04-16 09:00:07
1947
原创 基于deepseek的智能语音客服【第四讲】封装milvus数据库连接池封装
【代码】基于deepseek的智能语音客服【第四讲】封装milvus数据库连接池封装。
2025-03-22 22:53:19
255
原创 基于deepseek的智能语音客服【第二讲】后端异步接口调用封装
为什么要进行异步分装?因为前段需要流式输出,以减少用户长时间等待造成的不良体验集成HttpServlet 实现POST方法,get方式多伦对话有数据了限制。
2025-03-19 21:37:57
582
原创 基于deepseek的智能语音客服【第一讲】整体技术架构
全程无尿点,只讲重点,代码实现。不讲ollama、anythingllm、dify、coze【完整代码实战教程】通过 Java,Python,HTML 实现文本向量化、向量数据库操作、知识库建立、DeepSeek 模型调用及前端展示-最终实现智能问答。
2025-03-19 21:08:41
291
原创 Ubuntu 服务器安装 Python 环境 的详细指南
以下是 在 Ubuntu 上安装 Python 3.10 的详细步骤(兼容 Ubuntu 20.04/22.04):2. 安装 Python 3.103. 验证安装方法二:手动编译安装(自定义路径)1. 安装编译依赖2. 下载 Python 3.10 源码3. 编译安装(到 )4. 验证安装配置 Python 3.10 为默认版本(可选)1. 查看当前 Python 版本2. 更新 alternatives 配置3. 切换默认版本按提示选择 Python 3.1
2025-03-14 23:44:07
1902
原创 Java 8 + Tomcat 9.0.102 的稳定环境搭建方案,适用于生产环境
一、安装 Java 8安装 OpenJDK 8bash验证安装bash。
2025-03-14 23:12:10
1185
原创 【完整代码实战教程RAG增强+embedding=deeps】通过 Java,Python,HTML 实现文本向量化、向量数据库操作、知识库建立、DeepSeek 模型调用及前端展示-最终实现智能问答
【完整代码实战教程】通过 Java,Python,HTML 实现文本向量化、向量数据库操作、知识库建立、DeepSeek 模型调用及前端展示-最终实现智能问答。文本向量化: 使用 all-MiniLM-L6-v2 模型将文本转换为向量。DeepSeek 模型调用: 调用 DeepSeek API 进行文本生成。前端展示: 使用 HTML 和 JavaScript 实现交互式前端界面。完整代码实现: 从文本向量化到前端展示的完整代码实战。技术深度解析: 详细讲解每个技术点的原理和实现细节。
2025-03-08 11:18:27
264
原创 libjemalloc安装
是一个高性能的内存分配器,特别适用于多线程应用程序。它旨在减少内存碎片并提升高并发场景下的内存分配效率。 最初由 Jason Evans 为 FreeBSD 开发,后来被广泛应用于多种应用程序和编程语言中,例如 Firefox、Redis、Rust 等。你可以从 的官方 GitHub 仓库下载源代码:或者,你可以直接下载特定版本的源代码包,例如:国内下载地址如果你在国内,可以使用 Gitee 的镜像仓库,该仓库每日同步一次:安装 在 Ubuntu/Debian 上安装你可以通过包管理器安装 :
2025-03-05 14:00:49
707
原创 Milvus安装linux操作步骤
文件,添加以下内容,以指定数据持久化路径为。这将停止并删除 Milvus 容器及其相关卷。通过以上步骤,您可以将 Milvus 安装在。如果您希望将 Milvus 安装在。目录下,并确保数据存储在指定路径。
2025-03-04 10:11:26
917
原创 SentenceTransformer` 模型的完整过程步骤,包括安装依赖、加载模型、编码文本、计算相似度、以及实际应用示例
以下是使用模型的完整过程步骤,包括安装依赖、加载模型、编码文本、计算相似度、以及实际应用示例。
2025-03-03 14:40:42
1473
原创 安装 Milvus 的详细步骤
通过以上步骤,你可以成功重新安装 Milvus。如果在安装过程中遇到任何问题,请告诉我具体的错误信息,我会进一步协助你。
2025-02-28 15:47:35
1737
原创 推理模型和非推理模型的特点和优势
非推理大模型: 适用于大多数任务,非推理大模型一般侧重于语言生成、上下文理解和自然语言处理,而不强调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像推理模型那样复杂的推理和决策能力。推理大模型: 推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。优势领域:这类模型经过专门训练,能够处理复杂的逻辑推理任务,例如数学问题、代码生成和复杂问题的拆解。劣势领域:在需要严格逻辑链的任务上表现较弱,例如数学证明或复杂的逻辑推理。
2025-02-09 11:02:25
3222
原创 Deepseek可以做什么?
提供实时信息(需联网时)或基于知识库的深度解析。翻译多语言内容,调整文本风格(正式/口语化)。调试错误、优化代码逻辑,提供算法思路。生成流程图、思维导图,辅助项目管理。辅助数据清洗、统计分析或简单建模。设计学习计划,生成练习题及解析。
2025-02-09 10:50:43
2554
原创 什么是deepseek?
其中智能分析引擎采用了先进的机器学习算法和深度学习模型,能够自动识别数据中的模式和趋势,进行复杂的关联分析和预测建模。这种开源策略降低了中小企业和个人开发者的使用成本,推动了 AI 技术的普及和应用。•混合专家模型(MoE):通过训练多个专家模型,并根据输入数据特征动态选择最合适的专家模型进行处理,实现对复杂任务的高效处理。•深度学习与自然语言处理:通过大量数据训练,能够理解和处理复杂问题,提供个性化建议。•多头潜在注意力机制(MLA):显著降低了模型推理成本,提高了模型的运行效率。
2025-02-09 10:21:39
788
原创 org.apache.catalina.loader.WebappClassLoaderBase.clearReferencesObjectStreamClassCaches 无法清除web应用程序[
我们看到是因为jdk高版本对有些方法进行了限制,只需要修改tomcat配置,忽略参数即可。打开 catalina.bat 文件。
2025-01-25 22:17:20
757
原创 农业病害、虫害、草害数据库
农业病害、虫害、草害数据库32大类,4239条数据,含名称、类型、介绍、主要特征,发病周期、危害症状、防御措施等。数据格式为mysql数据库格式。该数据库旨在为农业研究人员、农民和相关机构提供全面的病虫草害信息,帮助他们更好地预防和管理农业病虫草害。可以使用该数据开发病虫妨害软件,利用人工智能大数据精准匹配分析灾害。
2024-11-17 16:56:43
1329
原创 海康视频监控云台位置切换与拍照图片下载
随着物联网技术的发展,摄像头在各种应用场景中变得越来越重要,从家庭安全监控到工业自动化,再到智能交通管理。本文将详细介绍如何通过API控制摄像头的位置,并获取摄像头拍摄的照片。我们将使用HTTP请求发送控制指令和获取图像数据,并通过Java代码实现这一过程。
2024-11-17 16:32:43
934
原创 无极低码课程【3.配置文件修改。4.服务启动 无极低码基础版部署】
无极低码是一个面向开发者的工具,旨在为开发者、创业者或研发企业,提供快速,高效,标准化,可定制,私有化部署的平台,在兼顾开发速度的同时,兼顾标准化,低学习门槛,高灵活性和扩展性。不会写代码也可以写服务, 会写sql就会写服务, 5分钟学会操作, 会写代码可以进行二开定制开, 一键部署服务无需重启, 一键生成后端代码,一键生成管理端代码, 一键生成postman测试接口!帮您进行快速开发应用 快来下载试试吧!
2024-10-25 21:40:01
391
原创 无极低码课程【1.本地环境安装 tomcat部署windows环境厂家乱码处理】,一篇文章让你解决jdk版本,tomcat版本,输出输出流、数据库等所有遇到的乱码问题
本文介绍了Windows下Tomcat的安装步骤及中文乱码问题的解决方案。安装部分提供了两个下载地址,并指导如何启动Tomcat。重点针对HTML页面乱码问题,提出了4种解决方法:设置HTML页面编码、修改Tomcat配置文件、调整JVM编码参数、修改web.xml配置。此外,还提供了控制台日志、数据库检索、内置服务器启动等场景下的乱码处理方案,包括修改日志编码、指定数据库连接参数、设置JVM环境变量等。最后强调了在不同环境中统一编码规范的重要性,并给出了检查当前编码的方法。
2024-10-15 17:45:00
1301
原创 无极低码课程【1.本地环境安装 mysql windows下安装要点】
MySQL 是世界上最流行的开源关系型数据库管理系统之一。本教程将指导您在Windows操作系统上安装MySQL 5.7。
2024-10-14 17:35:28
606
原创 无极低码课程【1.本地环境安装 java(jdk)windows下安装及环境变量配置】
Java Development Kit (JDK) 是开发Java应用程序所必需的工具包。本教程将指导您在Windows操作系统上安装JDK 7。
2024-10-14 17:34:54
339
农业病害、虫害、草害数据库
2024-11-17
xmind 8 思维导图,windows版本安装包
2024-11-12
红豆地球V1.247 - 免费版
2024-07-14
气象数据分析实用程序(来自于大气所李建平,fortran程序)
2024-07-14
全国高等院校5000万、中学学校1.2万、职业技术学校7万、小学学校20万数据,包含位置经纬度电话名称等信息
2024-07-04
丝绸之路路线包括海上丝绸之路路上丝绸之路古代丝绸之路申遗丝绸之路丝绸之路文化遗址丝绸之路重要城镇
2024-07-04
全国乡村社区行政编码数据约68万,包含json和cvs格式,字段包括,乡村名称、生市县镇村编码
2024-06-14
全国行政区划边界geojson数据集,可用于gis地图边界绘制,echart地图绘制
2024-06-14
气象数据的多维度三维可视化效果演示代码
2024-05-30
echart+html5+css3实现大屏监控可视化
2024-05-20
数字民政智慧民政数据大屏设计Axure源文件
2024-04-05
Xshell、xftp7、xmanager7包含安装使用教程
2024-04-04
xmanager7 远程工具
2024-04-04
JSqlParser开源SQL解析库jar
2024-04-04
无极低码官网地址是什么?
2024-03-08
无极低码是什么,能干什么?
2024-03-08
程序员的工资,有多少人达到了中位数[face]emoji:002.png[/face]
2021-05-13
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅