普通网友-优快云博客

原创使用 Milvus 向量存储实现自查询检索器

在现代AI系统中，存储和检索大量向量化数据是一个常见的需求。Milvus是一个专注于存储、索引和管理由深度神经网络和其他机器学习模型生成的大规模嵌入向量的数据库。本文将演示如何使用Milvus向量存储与自查询检索器（SelfQueryRetriever）结合，以实现强大的数据检索功能。

2025-01-24 07:26:11 421

原创在 Astra DB 中使用 SelfQueryRetriever 进行向量存储与查询

在构建此类系统时，请务必确保数据的安全性与合规性。使用稳定可靠的 API 服务，以确保系统的高可用性和性能。最后，定期更新向量模型和库以跟随最新技术发展。这种向量检索机制非常适合用于需要自然语言交互的应用场景，如智能搜索引擎、推荐系统等。对于数据丰富的电影平台，可以让用户通过简单询问来获取个性化推荐。如果遇到问题欢迎在评论区交流。

2025-01-24 06:56:27 208

原创利用 OpenAPI 代理实现复杂 API 的层次化规划

层次化规划是一个常用于机器人学中的方法，现在也被引入到自然语言处理和 API 集成领域。它的基本思想是通过分离关注点，来实现对长序列行为的一致性管理：规划器（planner）负责决定调用哪些端点，而控制器（controller）负责具体调用这些端点的细节。

2025-01-24 02:02:26 376

原创使用MultiON Toolkit来增强LangChain的功能

MultiON Toolkit 是一种工具包，允许开发人员将 LangChain 框架连接到 MultiON 的浏览器扩展，从而实现复杂的代理工作流。MultiON 的 AI 代理能够与各种 web 服务交互，执行多种任务，可以极大地提升自动化工作流的效率。

2025-01-24 01:14:37 487

原创使用Infobip API 发送短信和邮件的实战指南

Infobip 是一个全球化的通信平台，提供了包括短信、邮件在内的多种服务。通过使用Infobip的API，我们可以轻松集成这些通信功能到我们的应用中。本指南将重点介绍如何调用Infobip API来发送短信和邮件，并且展示在Python中如何编写相关代码。

2025-01-24 01:02:43 716

原创使用Alpha Vantage实现实时与历史金融市场数据获取

在金融市场上，准确和及时的数据对于交易者、投资者和研究人员来说至关重要。而Alpha Vantage通过提供一套强大且开发者友好的数据API和电子表格，解决了从获取实时和历史金融数据到分析市场趋势的需求。本文将介绍如何使用Alpha Vantage API来获取货币兑换率、股票每日和每周时间序列数据、最新股票报价等，并展示相关代码示例，帮助开发者快速上手这些API进行数据获取和分析。

2025-01-23 23:40:51 957

原创使用 TiDB Loader 在 LangChain 中加载数据的实战指南

在AI应用开发过程中，数据库的选择至关重要。TiDB Cloud 提供了一种全面的数据库即服务 (DBaaS) 解决方案，包括专用和无服务器选项。特别是 TiDB Serverless 的引入，使得在 MySQL 上无缝集成向量搜索成为现实。此项功能使得开发者不需要额外的新数据库或技术栈，就能轻松开发AI应用。我们今天将介绍如何使用 TiDB Loader 从 TiDB 加载数据到 LangChain。

2025-01-23 19:20:45 480

原创使用AI技术从Telegram导入数据到LangChain

Telegram是一款全球范围内可供使用的即时通讯软件，支持多种平台并提供安全的加密通讯。对于开发者而言，它提供了丰富的API接口，可以用于自动化数据处理和集成。本文将介绍如何将Telegram中的聊天数据导入到LangChain，这是一种数据处理和分析工具，能够帮助开发者更高效地管理和分析聊天记录。

2025-01-23 18:58:28 544

原创使用 Python 从 Slack Zipfile 加载文档数据

Slack 是一种流行的即时通讯工具，可用于团队协作和沟通。Slack 提供了导出功能，允许用户将通信记录导出为一个 Zip 文件格式，这有助于离线查看和长期保存记录。使用合适的工具和库，我们可以轻松地读取和分析这些数据。

2025-01-23 18:29:41 421

原创使用 ScrapingAnt 进行高效网页数据抓取

如果遇到问题欢迎在评论区交流。

2025-01-23 18:18:31 307

原创使用UnstructuredOrgModeLoader加载Org-mode文档的实用指南

Org-mode不仅仅是一个简单的文本编辑工具，它提供了强大的文档结构化功能，如标题、列表、表格等，这些特性使得Org-mode文件成为数据驱动应用程序的一个重要数据源。然而，如何在应用程序中读取这些结构化数据成为了一个挑战。UnstructuredOrgModeLoader库应运而生，它简便地解析这些文件并提取有用的信息。

2025-01-23 17:25:17 313

原创使用 Oracle AI Vector Search 进行文档处理和分块

Oracle AI Vector Search 是一个功能强大的AI工具，允许您基于语义而非关键词进行数据查询。它的一个显著优势是能够在一个系统中将非结构化数据的语义搜索与业务数据的关系型搜索相结合。这不仅提升了效率，还减少了数据在多个系统之间分散的问题。Oracle AI Vector Search 提供了一系列强大的功能，例如分区支持、异地分片处理、并行SQL，以及灾难恢复和安全性等。这些功能使其成为处理大型、复杂数据集的理想选择。

2025-01-23 17:19:41 313

原创如何从Oracle Autonomous Database加载文档

Oracle Autonomous Database通过自动化的方式极大地简化了数据库管理的复杂性。它支持多种连接方式，使得开发者能够根据实际场景选择最佳的连接策略。在本文中，我们将重点介绍如何通过Python程序从Oracle Autonomous Database中加载数据。

2025-01-23 17:13:25 506

原创使用 NotionDBLoader 从 Notion 数据库加载文档的实战指南

Notion 作为一款功能集成的协作平台，允许用户创建和管理文档、数据库、任务等。为了程序化地加载 Notion 数据库的内容，我们需要借助，这是langchain包中的一个文档加载器类。它帮助我们从 Notion 数据库中提取页面及其元数据，并返回一个文档对象列表。

2025-01-23 16:58:25 446

原创探索Baichuan文本嵌入：中文任务的顶级选择

在自然语言处理（NLP）领域，文本嵌入是一个关键技术，它将文本数据转化为数值向量，为进一步的机器学习处理奠定基础。截至2024年1月25日，BaichuanTextEmbeddings在C-MTEB（中文多任务嵌入基准）的排行榜中排名第一，成为中文文本任务的首选嵌入模型。该模型的优势不仅体现在其卓越的性能上，还包括其在中文文本处理方面的专注，为用户提供了一个高效且稳定的解决方案。

2025-01-23 09:14:41 484

原创深入解析AscendEmbeddings模型在文本嵌入中的应用

文本嵌入技术在自然语言处理（NLP）中的应用日益广泛，它将文本数据转换为定长向量，从而使计算机能够处理和分析文本间的语义关系。Langchain Community的AscendEmbeddings提供了一种简便可靠的方式来实现文本嵌入，广泛适用于文本搜索、相似度计算等场景。

2025-01-23 09:03:40 300

原创使用AnyscaleEmbeddings进行文本嵌入的实战指南

如果遇到问题欢迎在评论区交流。

2025-01-23 08:58:12 186

原创如何利用ChatPerplexity聊天模型进行智能对话

ChatPerplexity是一种强大的聊天模型，基于先进的自然语言处理技术，能够理解和生成高质量的自然语言文本。它被广泛应用于智能客服、虚拟助手、人机交互等领域。

2025-01-23 02:04:11 438

原创从ErnieBotChat迁移到QianfanChatEndpoint的实践指南

ErnieBot是由百度开发的大型语言模型，拥有强大的中文数据处理能力。然而，由于ErnieBotChat在功能和维护上的不足，官方建议开发者切换到功能更强大的QianfanChatEndpoint。QianfanChatEndpoint在流式传输、函数调用能力等方面提供了更为先进的支持。

2025-01-23 00:37:18 617

原创使用Amazon API Gateway构建和管理你的API

Amazon API Gateway充当应用与后端服务之间的“前门”，支持创建RESTful API和WebSocket API。它适用于容器化和无服务器工作负载，支持数十万并发API调用，并提供了流量管理、CORS支持、授权和访问控制、流控、监控和API版本管理等功能。API Gateway按照调用数量和数据传输量计费，并通过分级定价模型降低成本。

2025-01-22 21:36:58 716

原创利用PromptLayer提升LangChain中的Prompt工程能力

PromptLayer不仅提供了一系列的LLM（如PromptLayerOpenAI）直接用于LangChain，还推荐了一种更灵活的集成方式：使用回调机制。借助PromptLayer的回调机制，我们能够更好地跟踪和优化Prompt，并提升LangChain应用的整体性能。

2025-01-22 17:26:14 414

原创使用Portkey AI网关优化Langchain应用开发

Portkey是一个控制面板，专为AI应用开发设计。它的AI网关可以通过统一的API连接到150多种模型，并为所有请求提供42+指标和日志，实现语义缓存以降低延迟和成本，并提供自动重试和回退机制。本文将重点介绍Portkey与Langchain的集成。

2025-01-22 17:09:20 413

原创使用LanceDB扩展LangChain：安装与应用

LanceDB是一种高效的数据库管理工具，特别适用于大规模数据存储和检索。它在LangChain中被用作一个包装器，主要用于向量存储的场景，如语义搜索和示例选择。借助LanceDB，开发者可以轻松地管理和操作复杂的数据集。

2025-01-22 14:01:05 563

原创使用Konko AI快速集成和部署大语言模型(LLM)应用

Konko AI通过提供全方位的API服务，极大地简化了开发者选择和集成大型语言模型的过程。不仅支持快速的应用开发，还提供了强大的模型微调功能，使得开发者能够以更低的成本达到业界领先的性能。此外，Konko AI的基础设施已获得SOC 2认证，支持多云架构，保证了生产部署的安全性和高效性。

2025-01-22 13:41:25 349

原创使用ClearML进行Langchain实验管理和结果跟踪

ClearML通过其模块帮助开发者和研究人员从实验到生产无缝过渡。ClearML的实验管理器能够自动跟踪和组织所有实验运行，无需手动干预。而通过与Langchain结合，我们可以实现对语言模型实验的自动化管理和细粒度监控。

2025-01-22 06:39:40 379

原创使用Spark SQL Toolkit进行数据分析

Spark SQL作为Apache Spark的一个模块，提供了对结构化数据的支持。它允许用户通过SQL查询数据，同时还能融合Spark的其它组件共同工作。为了更智能地与Spark SQL进行交互，我们可以利用AI代理技术，特别是LangChain中的Spark SQL Toolkit，它可以处理自然语言查询，转化为SQL查询，并从数据结果中提取信息。

2025-01-22 02:09:02 476

原创使用AWS Bedrock服务进行RAG文本生成和嵌入

AWS Bedrock 是一个托管服务，提供了一系列基础模型（Foundation Models），旨在简化AI应用的开发。通过使用Anthropic Claude与Amazon Titan，我们可以实现强大的文本生成和嵌入功能。这些模型可以在许多语言处理任务中提供高质量的性能，如问答系统、内容总结等。

2025-01-21 18:17:39 543

原创使用Astra DB进行RAG应用开发指南

RAG是一种通过结合检索和生成技术，从数据库中获取相关信息并生成自然语言回答的技术。Astra DB是一个由DataStax提供的分布式数据库，支持向量存储。它与LangChain结合，能够增强RAG应用的检索和处理能力。

2025-01-21 18:11:34 403

原创可配置的「海盗语言转换器」：使用多模型提供商的LangChain应用

语言模型提供商如OpenAI、Anthropic和Cohere都提供强大的自然语言处理能力。通过让应用能够从这些提供商中进行选择，我们可以根据具体需求和预算选择最合适的服务。

2025-01-21 17:41:01 330

原创创建一个PII保护的聊天机器人

在构建聊天机器人时，用户可能会无意中分享诸如姓名、地址、电话号码等个人信息。为了使我们的应用程序对用户更加友好且符合隐私保护要求，我们需要一种机制来检测和保护这些信息不被传递到更大范围的机器学习模型中。LangChain是一个用于构建强大和可扩展的AI应用的工具，它提供了一种简单的方法来添加隐私保护功能。通过使用LangChain的，我们可以轻松实现这一目标。

2025-01-21 17:35:18 481

原创使用OpenAI LLM与Neo4j数据库的自然语言交互

Neo4j是一种强大的图数据库管理系统，支持Cypher查询语言，非常适合处理复杂的关系数据。而将其与OpenAI的语言模型结合，可以实现在数据库中进行自然语言查询，无需具备Cypher的专业知识。

2025-01-21 16:24:56 370

原创使用自然语言与Neo4j交互：Neo4j-Cypher-FT的实现

随着图数据库的发展，Neo4j因其强大的关系数据处理能力而被广泛使用。而Cypher作为Neo4j的查询语言，虽然强大，但对很多用户来说却不够直观。为了解决这个问题，Neo4j-Cypher-FT项目利用OpenAI的语言模型，将自然语言转换为Cypher查询，使得即使不懂Cypher的用户也可以方便地与数据库交互。

2025-01-21 16:18:43 667

原创使用MongoDB和OpenAI实现父文档检索的RAG技术

在现代信息检索中，结合MongoDB和OpenAI，实现先进的检索-生成（RAG, Retrieval-Augmented Generation）流程是一个热门话题。尤其是父文档检索（Parent Document Retrieval）技术，通过对文档进行多层次切分，使得检索更精确且生成内容更具上下文关联性。

2025-01-21 16:06:54 327

原创使用 Fireworks 模型与 Langchain 集成指南

Fireworks 是一个强大的语言模型系列，提供多种预训练模型如，适用于各种自然语言处理任务。Langchain 则是一种框架，方便开发者在应用中集成不同的语言模型。

2025-01-21 11:51:49 334

原创深入了解LangChain中的Key-Value存储

Key-Value存储是一种非关系型数据库，它通过一对一的键值对来存储数据，这种结构使得数据的插入和检索都非常高效，尤其适合于需要快速读取和写入的场景中。在LangChain中，Key-Value存储被其他组件使用，以便在需要时快速存储和检索数据。

2025-01-21 10:21:33 432

原创如何拆分JSON数据

在数据科学和AI应用中，处理大型JSON数据对象是常见的需求。然而，直接处理过大的JSON数据可能导致内存占用过高，甚至造成程序崩溃。因此，将JSON数据拆分成合适大小的块是提高数据处理效率的关键。提供了一种灵活的方法，通过控制块大小来拆分JSON，同时最大程度保持数据的整体结构。

2025-01-21 04:34:09 499

原创使用MarkdownHeaderTextSplitter按标题拆分Markdown文档

在处理聊天应用或者问答系统时，通常需要将输入文档分块以便于嵌入和向量存储。嵌入整段文本时，嵌入过程会考虑文本的上下文以及句子和短语之间的关系，这使得向量能够反映文本的更广泛含义和主题。然而，当我们处理Markdown文档时，以标题为基础进行分块显得尤为直观，这也是我们使用的关键动机。

2025-01-21 02:47:03 691

原创本地运行大型语言模型(LLM)的实践指南

开源LLM：一个可以自由修改和共享的开源LLM。推理能力：能够在设备上以可接受的延迟运行此LLM。

2025-01-21 02:30:11 599

原创如何在LangChain中创建自定义工具

LangChain是一个灵活的框架，支持自然语言处理应用的开发，尤其是那些需要结合多个工具和流程的应用。在LangChain中，工具是帮助语言模型（LLM）或智能代理执行特定任务的基本构件。通过创建自定义工具，可以使代理更有效地完成特定的任务。

2025-01-20 23:57:45 741

原创在异步环境中使用回调的实践指南

在异步编程模型中，回调函数用于在特定事件发生后执行某个逻辑，而不阻塞事件循环。对于使用语言模型（LLM）和其他链式调用（Chain/Tool/Agent）的应用程序，通过使用异步回调，您可以实现更高效的程序。

2025-01-20 22:29:41 341

空空如也

空空如也