普通网友-优快云博客

原创 `使用 OpenSearch 实现自查询检索器的实践指南`

OpenSearch 是一个可扩展、灵活且易扩展的开源软件套件，适用于搜索、分析和可观测性应用。它基于 Apache Lucene 构建，是一个分布式搜索和分析引擎。在本文中，我们将展示如何使用 OpenSearch 向量存储器来实现自查询检索器并进行演示。

2025-01-24 07:32:22 199

原创使用大语言模型(LLM)为NebulaGraph提供自然语言接口

NebulaGraph通过Docker容器化部署提供了非常便捷的安装方式。当然，也有其他部署选项，比如作为Docker Desktop扩展安装，或者使用NebulaGraph云服务等。

2025-01-24 04:19:58 402

原创使用Apache AGE和LLMs实现自然语言图数据库查询

Apache AGE 是一个为 PostgreSQL 提供图数据库功能的扩展，以实现同时支持关系型和图模型数据的单一存储。AGE 的灵感来源于 Bitnine 的 PostgreSQL 10 分支，AgensGraph，目标是让用户可以在标准 ANSI SQL 和 openCypher 图查询语言中自由切换。本次我们将展示如何利用大型语言模型（LLMs）为图数据库构建自然语言接口，并通过 Cypher 查询语言进行数据查询。

2025-01-24 03:46:20 236

原创如何使用Wikidata API进行数据查询

Wikidata是一个免费且开放的知识库, 它可以被人类和机器读取和编辑。Wikidata是世界上最大的开放知识库之一，广泛应用于数据集成、数据查询、数据分析等方面。在本篇文章中，我们将展示如何使用Wikidata API进行数据查询。首先，我们需要安装两个Python包:和。

2025-01-24 02:39:02 470

原创如何从Notion数据库导入文档

Notion作为一款功能强大的协作平台，其提供的数据库功能使得用户可以轻松地管理和组织信息。对于开发人员来说，能够从Notion数据库中提取数据可用于进一步的数据处理和分析是非常有用的。本文将介绍如何通过快速导入Notion数据库导出的文档。

2025-01-23 16:47:52 458

原创使用MHTMLLoader解析MHTML文件中的网页内容

MHTML是一种用于保存完整网页内容的文件格式，它将HTML代码、图片、音频文件、动画等资源打包到一个单一文件中。这种格式特别适用于网页的存档与共享。LangChain社区提供了一个名为的工具类，方便开发者从MHTML文件中提取和加载文档内容，使得在处理存档网页时变得非常简便。

2025-01-23 16:23:40 296

原创使用LangChain加载Jupyter Notebook数据的实战指南

ipynb。

2025-01-23 15:35:08 283

原创如何使用GitPython和LangChain加载Git仓库中的文本文件

Git是一个用于跟踪文件更改的工具，非常适合于团队合作的软件开发项目。GitPython是一个Python库，它提供了对Git存储库操作的接口，使Python可以直接与Git仓库交互。LangChain社区则扩展了这一功能，通过其文档加载器让我们能够更方便地加载和处理代码仓库中的文件。

2025-01-23 14:08:46 377

原创使用Voyage AI嵌入模型构建语义检索系统实战

嵌入模型的核心作用是将文本转换为向量，其特点是向量之间的距离可以反映文本语义的相关性。通过这种方式，我们可以实现语义层面的搜索，而不只是基于关键字的匹配。Voyage AI 提供了多种嵌入模型，可根据领域需求选择最适合的模型，例如面向法律、金融和多语言环境的预训练模型。

2025-01-23 12:00:39 319

原创使用Meta AI的LASER实现多语言句子嵌入

LASER是Meta AI开发的一个Python库，其目标是生成语言不可知的句子嵌入，支持广泛的语言组合。这意味着LASER能够将不同语言的文本转换成统一格式的向量表示，便于在多语言环境下进行分析和处理。支持的语言列表可以在这里查看。

2025-01-23 11:19:29 526

原创在Intel CPU上使用IPEX-LLM进行本地BGE嵌入

IPEX-LLM是一种用于在Intel的CPU和GPU（如集成显卡iGPU、离散显卡Arc、Flex和Max等）上运行大型语言模型（LLM）的PyTorch库，具有非常低的延迟，这使得它特别适合在本地设备上进行高效的AI推理。

2025-01-23 10:55:54 364

原创使用Infinity Embeddings实现文档嵌入和查询

Infinity项目提供了一种通过MIT许可的嵌入服务器创建文档嵌入的方式。它支持多种深度学习模型，如，可以方便地用于Python代码中。Langchain是一个有用的库，帮助我们处理嵌入操作。

2025-01-23 10:50:13 321

原创使用FastEmbed快速生成文档和查询嵌入

FastEmbed通过使用量化模型权重和ONNX Runtime实现快速的嵌入生成，无需依赖PyTorch。同时，它采用面向CPU的设计和数据并行处理来提升大数据集编码的效率。这使得FastEmbed非常适合在资源有限的环境下或离线大规模处理环境中使用。

2025-01-23 10:16:24 320

原创使用Baidu Qianfan平台进行Langchain嵌入模型开发

Baidu AI Cloud Qianfan平台是为企业开发者提供的大模型开发和服务运营平台。通过Qianfan，用户可以访问到诸如文心一言 (ERNIE-Bot) 的模型以及各种第三方开源模型。同时，平台也提供了丰富的AI开发工具和完整的开发环境，使得用户能够方便地开发和运行大模型应用。

2025-01-23 09:20:08 137

原创使用LangChain与Replicate模型交互的实践指南

此流程非常适合需要大规模运行复杂AI任务的应用场景，例如自动化客户支持、自然语言处理应用程序、图像生成服务等。通过将LangChain与Replicate结合，开发者可以轻松组合多个AI任务步骤，创建复杂的AI驱动应用程序。以下示例展示了如何调用Meta Llama 3模型。如果遇到问题欢迎在评论区交流。

2025-01-23 07:44:09 280

原创使用LangChain与NLP Cloud进行高效自然语言处理

随着自然语言处理（NLP）技术的不断发展，市场涌现了许多支持高性能预训练和自定义模型的平台，如NLP Cloud。该平台提供了各种功能，包括命名实体识别、情感分析、文本分类等，能够通过REST API直接投入生产使用。为了更好地利用这些模型，LangChain是一个非常优秀的框架，它可以简化与NLP Cloud模型的交互。本文将展示如何使用LangChain与NLP Cloud进行自然语言处理。

2025-01-23 06:31:21 312

原创使用LangChain与C Transformers库进行模型交互

C Transformers库旨在简化与GGML模型的交互，为用户提供便捷的API来加载和调用这些模型。在自然语言处理的领域中，GGML模型以其高效的性能和轻量级的特点而广受欢迎。

2025-01-23 04:04:29 358

原创使用Obsidian加载器管理你的本地知识库

Obsidian提供了一种灵活的笔记管理方式，通过Markdown文件实现本地化的知识管理。这种方式不仅保证了数据的所有权，还可以与其他工具无缝集成，如命令行工具和其他Markdown编辑器。

2025-01-22 16:26:50 426

原创利用Minimax进行自然语言处理的实战指南

Minimax提供了一系列强大的NLP工具，帮助开发者轻松构建基于自然语言处理的应用。API支持多种功能，包括语言生成、文本嵌入和聊天模型。通过这些工具，开发者可以在短时间内为产品增加NLP功能，从而提升用户体验。

2025-01-22 15:05:11 368

原创使用iFixit API进行设备维修数据加载和分析

iFixit提供了近10万份维修手册和超过20万的问答数据，覆盖了4万多种设备。这些数据都在CC-BY-NC-SA 3.0许可下提供，使得开发者可以自由使用这些资源来进行应用开发。

2025-01-22 12:20:01 275

原创使用Eden AI进行无代码AI项目开发

Eden AI是一款集成了多种AI引擎的平台，用户可以通过其UI界面轻松管理AI项目。它通过集成不同类型的API接口，如语言模型、聊天模型、嵌入模型等，满足了多样化的AI需求。

2025-01-22 09:23:31 231

原创使用Discord数据进行分析和加载

Discord是一款流行的VoIP和即时消息社交平台，用户可以通过语音、视频通话以及文字消息来进行交流。为了提高用户体验，Discord允许用户请求并下载他们的个人数据，这包括在服务器中的聊天记录、媒体文件等。这为数据分析与研究提供了极大的便利。

2025-01-22 08:47:56 286

原创使用CnosDB进行高效时序数据查询与分析

CnosDB是一种专为处理时序数据而设计的数据库，支持快速的数据写入和高效的查询。它的架构允许分布式部署，从而在处理大量数据时保持高性能。CnosDB能够与不同的数据分析工具集成，是希望对时序数据进行实时分析的理想选择。

2025-01-22 06:56:13 403

原创在 LangChain 中使用 Banana 进行无服务器 GPU 推理

Banana 是一种无服务器（serverless）平台，专门用于 AI 模型的 GPU 推理。开发者可以通过该平台实现自动化部署和高效推理，并将其轻松集成到现有的开发工作流中。LangChain 是一个强大的工具，旨在简化和加速大型语言模型（LLM）的开发和应用。

2025-01-22 05:02:20 271

原创使用AssemblyAI进行语音转文本与分析

AssemblyAI是一家致力于构建语音AI模型的公司，其技术可以处理语音转文本、说话人识别、情感分析等任务。这些功能广泛应用于电话会议、播客等场景，帮助用户高效地提取音频内容。

2025-01-22 04:27:49 271

原创使用RAG-Conversation模板实现智能对话检索

RAG技术是近年来在自然语言处理领域非常热门的应用，它通过将检索到的相关文档与会话历史结合，增强生成模型的回答能力。这种方法尤其适用于需要精确回答和背景信息支持的对话场景。

2025-01-21 19:11:40 325

原创使用 Guardrails-Output-Parser 验证LLM输出

Guardrails-Output-Parser 是一个用于验证和清理 LLM 输出的工具。它被设计为一个中间层，可以在应用生成内容前对其进行检测和过滤。这个工具通过集成到 LangChain 项目中，可以方便地用于处理各种文本生成任务。

2025-01-21 15:36:49 647

原创使用Cohere Librarian将AI化身为“图书管理员”

Cohere Librarian是一款基于LangChain的工具集，旨在利用Cohere的强大自然语言处理能力创建一个智能图书推荐系统。通过集成多种功能模块，它不仅可以处理对话，还能够根据书籍元数据进行精确查询。

2025-01-21 15:02:45 259

原创如何利用模板为您的聊天机器人自动生成反馈

在构建和改进聊天机器人的过程中，用户反馈如“赞”或“踩”往往是稀缺的资源。即使在具有数千次互动的环境中，例如Chat Langchain中，仅有0.04%的查询获得了明确反馈。然而，约70%的查询是针对先前问题的后续，这意味着这些连续的多轮对话可以揭示出很多关于先前AI响应质量的信息。

2025-01-21 14:56:17 371

原创使用Apache Cassandra进行大规模LLM缓存：Cassandra Synonym Caching

大规模应用在处理大量请求时，通常需要高效地管理数据和缓存。Apache Cassandra是一个分布式数据库系统，因其高可用性和可扩展性而受到广泛欢迎。通过结合Cassandra，我们可以有效地缓存LLM的结果，提高响应速度。

2025-01-21 14:45:02 305

原创使用 Azure OpenAI 服务进行自然语言处理应用开发

Microsoft Azure 是微软提供的一个广泛的云计算平台，支持 SaaS、PaaS 和 IaaS 模型。Azure OpenAI 服务是 Azure 提供的基于 OpenAI 强大语言模型的云服务，包括 GPT-3、Codex 和 Embeddings 模型。这些模型可以用于内容生成、摘要、语义搜索和自然语言到代码的翻译。

2025-01-21 09:20:50 444

原创从ConversationChain迁移到LCEL实现详解

是一种用于进行状态保持会话的链式处理组件，它通过记忆类的协作来进行多轮问答。然而，它在功能扩展及易用性上存在一些限制，比如隐含的默认提示、有限的线程支持以及不太直观的流媒体支持。LCEL（LangChain Execution Layer）作为新一代实现，原生支持线程和独立会话，更显式的参数配置和更灵活的流媒体支持，能够更好地满足复杂应用的需求。

2025-01-21 07:51:08 320

原创如何将运行时值传递给LangChain工具

在使用LangChain时，您可能需要将诸如用户ID这样的参数绑定到工具上。这些参数在请求发出时才会确定，我们需要确保这些参数不会被LLM意外生成。

2025-01-21 06:26:57 242

原创如何基于语义相似性分割文本

文本分割是自然语言处理中的一项重要任务，尤其是在需要对长文档进行摘要、检索或进一步分析时。传统的分割方式通常基于固定的长度或简单的行分隔，而语义分割则灵活得多，能够识别并保存语义连贯的思想段落。

2025-01-21 05:02:25 679

原创如何从您的RAG应用程序中流式传输结果

在本文中，我们将深入探讨如何从RAG（检索增强生成）应用程序中流式传输结果。我们将介绍如何从最终输出以及链的中间步骤（例如，从查询重写中）流式传输令牌。本指南基于Lilian Weng的博客文章《LLM Powered Autonomous Agents》中构建的Q&A应用程序。我们会使用OpenAI嵌入和Chroma向量存储示例来说明该过程，但同样适用于任何嵌入、向量存储或检索器。

2025-01-21 04:28:36 528

原创如何创建动态链：基于输入的自构建链解析

随着对交互性和智能化需求的增加，许多应用需要在运行时根据用户输入动态调整处理逻辑。这常见于需要路由的应用，比如对不同问题类型采用不同的处理策略。LangChain通过的特性，使得这一需求的实现变得简单高效。

2025-01-21 00:47:16 418

原创如何处理API速率限制

在处理API调用时，速率限制是API提供者用来确保服务质量的一种常见机制。速率限制通常需要我们在一段时间内的请求量不超过特定的门槛。例如，在对聊天模型进行并行基准测试时，可能会频繁地触发速率限制，导致请求失败或响应延迟。通过实现速率限制器，我们可以在客户端层面上合理地控制请求流量。

2025-01-20 23:04:37 383

原创如何为可运行对象附加回调函数

在AI模型的执行过程中，尤其是在建立复杂的可运行链时，追踪每个步骤变得尤为重要。回调函数可以提供这种追踪能力，帮助开发者了解每个模型的执行状态和结果。

2025-01-20 22:35:11 346

原创多查询分析中的并发处理实践

在数据分析和信息检索领域，查询分析技术能够帮助我们生成和优化查询以提高搜索效率。然而，当同时生成多个查询时，处理这些查询并有效地合并结果就显得尤为重要。本次我们将使用langchain库来演示如何处理多查询情况。

2025-01-20 21:03:50 303

原创提升Graph-RAG查询生成的提示技巧

图数据库在处理关系型数据时，非常高效和灵活。然而，生成图数据库查询语言（如Cypher）的有效查询可能具有挑战性，特别是在使用自然语言生成查询时。因此，掌握如何创建有效的提示对生成准确的查询至关重要。

2025-01-20 19:55:32 219

空空如也

空空如也