- 博客(100)
- 收藏
- 关注
原创 使用TiDB存储聊天消息历史记录
TiDB Cloud是一个全面的数据库即服务(DBaaS)解决方案,包含专用和无服务器选项。其无服务器版本现在在MySQL环境中集成了一套完善的向量搜索功能。通过这一增强功能,您可以在不增加新的数据库或技术堆栈的情况下,无缝开发AI应用程序。
2025-01-24 05:50:17
297
原创 使用SQLite和AI实现简单的会话链存储
SQLite是一个用C语言编写的数据库引擎,它广泛用于多种应用程序中,因其嵌入式的特性被大量部署。与传统数据库不同,SQLite是一个库,软件开发人员可以将其嵌入到自己的应用程序中。
2025-01-24 05:39:11
432
原创 使用 Momento Cache 存储聊天消息历史
Momento Cache 是一种无服务器缓存服务,支持根据需求快速扩展或缩减资源使用,实现资源的高效利用。它通过简化缓存管理来帮助开发者更专注于业务逻辑的实现,而不必担心服务器的维护和扩展问题。
2025-01-24 05:10:49
259
原创 使用RDFLib在Python中处理RDF数据
RDFLib是一个功能强大的库,提供了一个Graph接口,可以通过各种存储实现(例如内存存储、磁盘持久化存储和远程SPARQL端点)进行支持。RDFLib还实现了SPARQL 1.1,支持查询和更新操作,是构建图数据库应用的理想选择。这篇文章将结合实际代码详细演示如何使用RDFLib管理RDF数据。
2025-01-24 04:36:33
429
原创 使用ZenGuard AI保护Langchain应用
随着生成式AI技术的普及,应用程序面临着各种可能的安全威胁,例如提示注入攻击、敏感信息泄露和不当内容生成。ZenGuard AI是一款专为Langchain应用设计的防护工具,提供高速且可靠的防护功能,确保您的AI应用安全运行。
2025-01-24 03:06:39
322
原创 使用Zapier Natural Language Actions与LangChain集成实现自动化工作流
Zapier Natural Language Actions(NLA)提供了一种通过自然语言接口访问Zapier平台上5000多个应用和20000多个操作的方法。通过NLA,你可以将自然语言翻译成具体的API调用并获取简化的输出。这使得在复杂的多应用环境中进行自动化操作变得更加轻松。然而需要注意的是,Zapier NLA将在2023年11月17日停用。
2025-01-24 03:01:01
757
原创 使用Python从SRT字幕文件加载数据的实战指南
SubRip格式被描述为所有字幕格式中最基本的一种。SubRip文件以扩展名.srt命名,包含按顺序编号的文本行,时间代码格式采用小时:分钟:秒,毫秒,其中时间单位固定为两个零填充数字,毫秒部分固定为三个零填充数字(例如由于该格式是在法国开发的,因此小数分隔符使用逗号。
2025-01-23 18:47:17
168
原创 使用Snowflake加载数据的实战指南
Snowflake作为一款云数据平台,可以处理海量数据并支持复杂的SQL查询。在数据处理工作流中,我们常常需要从Snowflake中提取数据以供后续分析和处理。为了简化这一过程,可以使用库进行数据加载。
2025-01-23 18:35:33
288
原创 使用GutenbergLoader加载Gutenberg电子书的实战指南
Project Gutenberg 是一个免费的电子书在线图书馆,提供了超过 6 万本电子书供用户免费访问和下载。对于数据科学家和开发者而言,如何将这些电子书加载为可用的数据格式是实现文本分析、自然语言处理等应用的第一步。本文将介绍如何使用这个工具将Gutenberg电子书链接加载为可进一步处理的文档格式。
2025-01-23 14:25:52
387
原创 使用Python从Dropbox加载文档的实战指南
Dropbox作为一个知名的文件托管服务,已经成为团队协作和个人存储的利器。为了在项目中利用Dropbox进行文件管理,我们需要使用Dropbox的API与之交互,从而实现自动化的文件加载与处理。
2025-01-23 13:10:39
246
原创 使用OpenLM与LangChain进行开放AI和HuggingFace模型推理
OpenLM旨在简化与多样LLM提供者的集成,消除了对特定API库的依赖。LangChain是一个灵活的框架,用于连接和管理大语言模型,使开发者能够轻松地组合不同的模型和任务。
2025-01-23 07:04:55
246
原创 通过 Huggingface Endpoints 实现高效的自然语言生成任务
Huggingface Endpoints 是一种基于 HTTP API 的接口,支持开发者访问 Huggingface Hub 上的模型服务。例如,文本生成推理是通过 Huggingface 自定义搭建的高效推理服务(Text Generation Inference)实现的,该服务结合了 Rust、Python 和 gRPC 技术,提供了非常快的推理速度。免费 Serverless Endpoints:无需配置,适合快速迭代,但可能会有速率限制。
2025-01-23 05:17:37
649
原创 使用vLLM作为OpenAI API的替代品进行聊天模型部署
vLLM是一款可以模拟OpenAI API协议的服务器,能够被用于替代OpenAI API的应用中。通过vLLM,你可以享受到与OpenAI相似的服务格式,而无需更改现有应用架构。本文将帮助你快速上手使用vLLM聊天模型,结合包,让AI服务的集成更加流畅。
2025-01-23 02:44:41
623
原创 利用LangChain与Snowflake Cortex进行大语言模型交互
Snowflake Cortex提供即时访问顶级大语言模型的能力,这些模型在处理自然语言时具有出色的性能。通过LangChain,我们可以方便地与这些模型进行交互,以实现各种自然语言处理任务。
2025-01-23 02:21:21
239
原创 以MLX LLM实现高级聊天模型的应用
此配置可以广泛应用于各种对话场景,例如智能客服、知识问答系统、互动娱乐等。通过对模型的配置和优化,可以实现与人类对话无异的自然交流。MLX提供多个LLM供选择,这里我们将使用。如果遇到问题欢迎在评论区交流。模型用作零样本代理。
2025-01-23 01:35:58
121
原创 使用 LlamaEdge 构建本地和在线LLM聊天服务
LlamaEdge 是一个专为 LLM 推理任务设计的服务,利用 WasmEdge Runtime 提供轻量级和可移植的 WebAssembly 容器环境,支持本地和在线的 LLM 交互。LlamaEdgeChatService 使得开发者能够通过 OpenAI API 兼容的服务与 LLMs 聊天,而即将推出的 LlamaEdgeChatLocal 将简化在本地设备上直接与 LLMs 交互的过程。
2025-01-23 01:24:39
373
原创 使用Nuclia自动化处理非结构化数据的完整指南
Nuclia是一个创新的平台,能够从内部和外部来源自动索引您的非结构化数据。通过其先进的AI技术,Nuclia不仅能提供优化的搜索结果,还能生成相应的回答。这对于希望在数据管理上达到更高效率的企业来说无疑是一个福音。
2025-01-22 16:21:21
250
原创 利用MediaWikiDump解析和处理Wiki数据
MediaWiki是许多Wiki(例如Wikipedia)后台的开源软件。使用MediaWiki XML Dumps,你可以获得Wiki页面的详细修订历史记录。这在数据分析和内容迁移等场景中非常有用。然而,为了处理这些数据,我们需要依赖一些专门的Python工具包。
2025-01-22 14:42:43
504
原创 使用Log10进行Langchain调用的日志管理和调试
Log10是什么?它是一个开源平台,支持无代理的LLM数据管理和应用开发。Log10专注于记录、调试和标记Langchain调用,帮助开发者更好地理解和优化AI模型的表现。
2025-01-22 14:31:42
795
原创 使用html2text将HTML转换为纯文本
HTML是一种用于在Web浏览器中显示内容的标记语言,其特性是包括大量的标记符号来定义文本的结构。而在许多情况下,如邮件分析、文本处理等场景中,我们需要从HTML中提取出纯文本内容,这就需要使用到HTML到文本的转换工具。
2025-01-22 12:02:29
307
原创 使用GitBookLoader加载GitBook文档
GitBook 是一个现代化的文档编写平台,广泛应用于团队产品文档、内部知识库以及API文档的编写和管理。为了让这些文档更有效地集成到AI应用中,许多开发者选择使用langchain提供的来自动化文档加载和处理。
2025-01-22 10:37:26
278
原创 利用Dataherald API通过LangChain实现自然语言到SQL转换
随着数据的爆炸性增长,如何让非技术人员能够直接查询数据库变得尤为重要。传统的SQL语言学习曲线较高,而自然语言查询结合AI技术可以降低这一门槛,使得任何人都可以进行复杂的数据分析。Dataherald基于机器学习模型,能够将自然语言直观地转化为SQL查询。
2025-01-22 08:13:24
316
原创 使用Browserbase平台进行AI数据检索的最佳实践
在现代AI应用中,从复杂的用户界面中提取数据是一项常见的需求。然而,如何可靠地运行和管理无头浏览器,成为很多开发者面临的挑战。Browserbase作为一款优秀的开发者平台,为此提供了解决方案。它提供了无服务器架构、隐身模式、会话调试等功能,帮助开发者高效进行数据检索。本文将介绍Browserbase的使用方法和其优势。
2025-01-22 06:01:44
227
原创 使用Python从arXiv获取和处理学术文献的实用指南
arXiv是一个覆盖物理学、数学、计算机科学等多个领域的开放访问学术文献平台。目前,它包含了超过200万篇学术文章。通过arXiv,研究者可以免费获取这些文献,并应用于自己的科研工作中。
2025-01-22 04:16:32
421
原创 使用 Pinecone 进行混合搜索:实践指南
Pinecone 是一个功能强大的向量数据库,支持广泛的搜索和检索操作。混合搜索结合了密集向量和稀疏向量的优势,提供更精准的文档检索。本文将通过实际代码示例,展示如何使用 Pinecone 的混合搜索功能进行检索。混合搜索结合了密集(dense)和稀疏(sparse)向量搜索的优点。密集向量通过模型嵌入生成,适用于语义相似度,而稀疏向量则利用传统的文本处理技术如 TF-IDF,适用于关键词匹配。使用 Pinecone,可以轻松地实现这种混合检索。应用场景分析混合搜索适用于需要在大规模文档库中进行高效检索
2025-01-22 02:47:06
151
原创 使用Bearly Code Interpreter实现远程代码执行示例
远程代码执行在现代软件开发中占据着重要地位。无论是测试新算法,还是在分布式环境中运行不受信任的代码,远程代码执行都能为开发者提供灵活性和安全性。Bearly Code Interpreter便是这样一个工具,它通过沙箱机制隔离代码执行,防止潜在的安全风险。
2025-01-22 02:02:53
346
原创 利用E2B环境进行数据分析 - 创建一个简单的OpenAI Agent
E2B的Data Analysis沙箱能够安全地执行代码,是构建自动化数据分析工具的理想选择。执行Python代码动态生成图表动态安装Python和系统包执行Shell命令文件上传和下载。
2025-01-22 01:57:17
523
原创 构建多角色认知协同代理:Solo Performance Prompting Agent
认知协同者是指能够与多个智能体协作,综合他们的个体优势和知识,以提升问题解决和整体性能的智能代理。SPP 通过动态识别和模拟不同的角色,根据任务输入释放 LLMs 的认知协同潜力。
2025-01-21 22:56:32
309
原创 使用Zep构建RAG对话应用的实战指南
RAG是一种结合信息检索与生成式AI技术的应用模式,能够在对话中动态地从外部知识库中检索相关信息,并将其与生成模型相结合。Zep提供了一整套功能来支持构建和生产化这样的应用。
2025-01-21 19:06:07
224
原创 使用NVIDIA RAG与Milvus Vector Store实现智能问答系统
在现代AI应用中,检索增强生成(Retrieval-Augmented Generation, RAG)是一个重要的技术,它结合了信息检索和文本生成的能力,能够更精确地回答用户的问题。NVIDIA提供了一套基于其强大硬件和软件生态的解决方案,这就包括了RAG技术。本文将详细介绍如何使用NVIDIA的RAG实现和Milvus Vector Store构建一个智能问答系统。
2025-01-21 17:06:36
267
原创 使用OpenAI函数调用实现信息抽取
OpenAI函数调用功能是由OpenAI提供的一项强大工具,能够从非结构化的输入文本中提取出具有特定格式的结构化数据。这对于需要对大规模文本进行分析和处理的应用来说,极为有用。
2025-01-21 15:25:47
310
原创 使用LangChain与LLMs在Elasticsearch中生成自然语言查询
Elasticsearch广泛应用于文本搜索和大数据分析领域,具有高效的分布式处理能力和强大的查询能力。然而,其复杂的DSL让许多用户望而却步。通过结合LangChain和LLMs(大语言模型),我们可以让用户通过自然语言与Elasticsearch交互,自动生成相应的DSL语句,从而降低使用门槛,提高工作效率。
2025-01-21 15:14:26
398
原创 使用Chain-of-Note进行Wikipedia检索的实战指南
在自然语言处理的领域中,检索增强生成(RAG, Retrieval-Augmented Generation)是一种利用外部数据库信息提升生成质量的方法。Chain-of-Note是一种新兴的RAG技术,它在Yu等研究者的论文中被详细阐述。通过整合Wikipedia等大型文本库,Chain-of-Note可以显著提高生成内容的准确性和丰富性。
2025-01-21 14:50:43
318
原创 利用Pinecone实现高效的向量数据库和检索功能
在现代AI应用中,向量数据库成为一种不可或缺的工具。Pinecone作为一个功能广泛的向量数据库,支持高效的语义搜索和实例选择。它提供了强大的API支持,使得开发者能够轻松地在应用中集成和使用向量数据库。
2025-01-21 12:41:45
375
原创 使用LangChain与AI21 Labs集成实现自然语言处理
LangChain是一个用于构建多步骤语言模型应用的框架,而AI21 Labs提供了先进的NLP模型,如语言模型(LLM)、上下文回答、聊天模型和嵌入模型。这两者结合后,可实现高效且高度定制的自然语言处理应用。
2025-01-21 11:06:05
257
原创 从ConversationalRetrievalChain迁移到LCEL实现
在构建智能问答系统时,提供了一种集成了检索增强生成(RAG)技术的方式,支持与文档的对话交互。然而,随着需求的复杂化,对系统内部结构的清晰性、可扩展性和性能需求日益提高,迁移到新的LCEL(LangChain Enriched Library)实现成为一个有吸引力的选择。更清晰的内部机制:LCEL清晰地呈现了问题重构步骤,易于理解和配置。返回源文档的能力:更方便地访问和展示原始文档数据。支持流处理和异步操作:提升应用的实时响应能力和性能。
2025-01-21 07:56:53
224
原创 使用 `trim_messages` 优化聊天消息长度
在与聊天模型交互时,信息的上下文窗口限制意味着我们不能无限制地传递长消息。为了提升对话效率并避免超出上下文窗口的限制,我们可以通过不同的策略修剪消息列表。
2025-01-21 07:00:35
289
原创 混合搜索在LangChain中的实现与应用
在LangChain中,标准搜索通常依赖于向量相似性。然而,许多向量存储实现(如Astra DB、ElasticSearch、Neo4J、AzureSearch、Qdrant等)还支持更高级的搜索功能,这些功能结合了向量相似搜索和其他技术(如全文搜索、BM25等),通常称为“混合”搜索。
2025-01-21 01:56:00
406
原创 如何使用最大边际相关性(MMR)进行示例选择
在进行机器学习模型训练时,拥有多样而相似的训练示例集合往往能够更好地提升模型的泛化能力。MMR通过在选择具有最大余弦相似度的示例时,同时引入多样性惩罚机制,以确保所选择的示例不仅与输入相似,而且在彼此之间也有差异。
2025-01-21 01:10:22
197
原创 如何创建自定义聊天模型类
聊天模型通常以消息为输入输出,并且这些消息有不同的类型。例如,用于初始的AI行为设置,代表用户的输入,而AIMessage则是AI的响应。这些消息可以是简单的文本,也可以涉及工具调用等复杂操作。
2025-01-20 23:39:49
498
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人