- 博客(81)
- 收藏
- 关注
原创 使用Weaviate构建自查询检索器来探索电影数据
在现代AI应用中,存储和检索海量的向量化数据是一个关键需求。Weaviate作为一个开源的向量数据库,可以帮助我们高效地存储和查询来自机器学习模型的数据对象及其向量嵌入,从而轻松扩展到数十亿的数据对象。在本次教程中,我们将展示如何利用Weaviate和自查询检索器来构建高效的数据检索系统。
2025-01-24 08:01:12
181
原创 使用 Trubrics 收集和分析 AI 模型的用户反馈
当部署大型语言模型(LLM)或聊天模型时,衡量用户体验和收集反馈至关重要。Trubrics 提供了一个平台,允许开发者记录用户输入(prompts)、模型响应以及用户反馈,这使得可以轻松跟踪模型的表现并进行改进。通过 Trubrics 与 LangChain 的结合,您可以轻松采集和管理用户对模型的交互和反馈数据。如果您正在构建 LLM 或聊天系统,这将是一个不可或缺的工具。如果遇到问题欢迎在评论区交流。—END—
2025-01-24 06:21:24
829
原创 快速创建交互式数据应用:Streamlit 和 StreamlitCallbackHandler 的结合使用
Streamlit 是一个旨在帮助开发者快速构建数据应用的框架。无需前端开发经验,数据科学家和工程师就能够轻松地创建美观的应用界面。而 StreamlitCallbackHandler 是 LangChain 库中的一个组件,它用于在 Streamlit 中实时展示 agent 的执行过程。
2025-01-24 06:15:53
290
原创 利用Diffbot NLP API和Neo4j构建动态知识图谱
在当今的数据驱动时代,提取和结构化处理文本数据中的信息变得尤为重要。Diffbot是一款基于机器学习的套件产品,能够轻松将网络数据结构化。其中的自然语言处理(NLP) API能够从非结构化文本中提取实体、关系和语义信息。我们可以将Diffbot的NLP API与Neo4j图数据库结合,构建功能强大的动态知识图谱,这些图谱能够被查询并集成到各类应用中。
2025-01-24 03:52:05
383
原创 使用AskNews实现实时新闻信息查询与应用
在当今信息爆炸的时代,实时获取最新的新闻资讯对决策制定至关重要。然而,如何在大量的新闻数据中提取出有用的信息,并将这些信息有效地传递给机器学习模型,是一个不小的挑战。AskNews提供了解决方案,通过自然语言查询,提供最新的全球新闻,并对新闻进行翻译、摘要、实体提取等处理,使得信息更易于理解和使用。
2025-01-23 23:46:58
303
原创 在Zilliz Cloud上使用Milvus进行向量搜索
Zilliz Cloud是基于LF AI Milvus®打造的全托管向量数据库云服务,支持处理大规模、高维度的向量数据。通过Zilliz Cloud,开发者可以轻松构建大规模机器学习和深度学习应用,利用Milvus的强大功能实现高效的向量相似性搜索。
2025-01-23 22:29:13
373
原创 使用NucliaDB进行文本向量化与检索
NucliaDB是一款强大的向量数据库,可以帮助开发者进行文本数据的向量化与检索。通过使用NucliaDB,您可以将文本数据存储在知识库中,并执行高效的相似度搜索。本文将介绍如何利用NucliaDB进行文本的向量化处理与检索操作。
2025-01-23 21:19:49
475
原创 使用UnstructuredXMLLoader加载XML文件
XML(eXtensible Markup Language)是一种用于描述数据的标记语言,常用于配置文件、数据传输和其他需要结构化数据的场景。解析XML文件通常需要用到专门的工具或库,就是这样一个方便的工具,能够帮助我们轻松加载和解析XML文件。
2025-01-23 19:44:28
312
原创 使用RSpace文档加载器将研究笔记和文档导入Langchain管道
RSpace是一款专为科研人员设计的电子实验室笔记工具,提供了强大的文档管理和API支持。Langchain则是一个用于构建语言模型应用程序的框架。在科学研究过程中,能将所有的实验记录集中在一个地方,并结合语言模型的处理能力,是非常有价值的。
2025-01-23 18:00:54
334
原创 使用Brave Search API进行文档检索的实战指南
Brave Search是一款由Brave Software开发的搜索引擎,其特点是利用自主开发的网页索引来提供搜索结果。到2022年5月,它已涵盖超过100亿个页面,并独立提供约92%的搜索结果。Brave Search的独立索引旨在减少垃圾邮件和低质量内容的出现,虽然在处理长尾查询时仍不如Google,但其隐私优先的设计吸引了众多用户。
2025-01-23 12:44:28
378
原创 使用ModelScope Embedding类实现文本嵌入
在自然语言处理中,文本嵌入 (Text Embedding) 是将文本转化为高维向量的过程。这种向量表示捕获了文本的语义信息,广泛应用于语义搜索、文本分类、推荐系统等任务。ModelScope是一个开放的模型和数据集库,提供了丰富的预训练模型,涵盖了计算机视觉、自然语言处理、语音处理等场景。在ModelScope中,你可以快速加载各种模型,无论是训练自己的模型还是在生产环境中进行预测。本文将介绍如何通过类对文本文档进行向量化处理,并通过实际代码示例演示其应用。通过 ModelScope 的。
2025-01-23 11:43:10
608
原创 使用 MistralAIEmbeddings 在 LangChain 中实现文本嵌入
文本嵌入是自然语言处理中的一项基础技术,通过将文本转换为向量表示,使得计算机可以理解和处理类似文本的语义信息。MistralAI 提供了一种高效的嵌入模型,,用于将文本转换为嵌入向量,便于在各种应用场景中进行分析和处理。
2025-01-23 11:37:20
263
原创 使用LangChain与Text-Generation-WebUI进行LLM模型交互
Text-Generation-WebUI是一个基于Gradio的Web用户界面,专用于运行大型语言模型。通过其API功能,我们可以使用编程方式与Web界面进行交互,从而实现自动化任务。
2025-01-23 08:01:57
284
原创 使用Langchain与Gradient API进行大规模语言模型微调和推理
Langchain是一个用于构建复杂文本生成应用的工具集,与Gradient的结合使得大规模语言模型的训练和部署变得更为容易。通过使用Gradient API,你可以利用其平台提供的计算资源和优化的模型,从而在少量数据上进行微调,实现模型定制。
2025-01-23 05:11:39
246
原创 在本地GPU上使用ExLlamaV2进行高效LLM推理
ExLlamaV2设计目的是在本地硬件上高效地运行大语言模型,支持使用Hugging Face上的GPTQ和EXL2量化模型。相比直接在云端使用,这种方法能够有效减少延迟并降低成本,适合那些对隐私和实时性要求较高的应用场景。
2025-01-23 04:32:44
274
原创 使用 DeepSparse 加速 LangChain 的深度学习模型推理
随着深度学习在各个领域的应用越来越广泛,对模型推理速度和效率的要求也越来越高。DeepSparse 是一种高性能推理引擎,专为稀疏模型设计,能够显著提高模型推理速度。结合 LangChain,可以使用 DeepSparse 来优化大语言模型(LLM)的推理性能,从而在大规模自然语言处理任务中获得更高的效率。
2025-01-23 04:21:17
385
原创 使用 Cloudflare Workers AI 构建智能回答助手
Cloudflare Workers AI 提供了一种使用 Serverless 架构来运行 AI 模型的方式。通过这种方式,开发者可以轻松地将AI功能集成到他们的应用中,而不需要管理底层的基础设施。Langchain库提供了一个简单的抽象层来更容易地集成各种语言模型,包括Cloudflare Workers AI。
2025-01-23 03:58:45
332
原创 基于LangChain与ChatPremAI的交互应用开发指南
LangChain是一个强大的工具库,旨在帮助开发者轻松地将语言模型集成到各种应用中。而ChatPremAI则作为一个一体化的平台,提供简化的生成式AI应用开发体验。结合这两者,开发者可以轻松与不同的聊天模型进行交互并构建复杂的AI驱动应用。
2025-01-23 02:10:22
400
原创 使用 Azure Container Apps 动态会话来安全执行 Python 代码
Azure Container Apps 为开发者提供了一个在云中运行轻量级容器的简便方法。通过动态会话,可以为不同的应用场景提供灵活的编程环境。这对机器学习模型的训练、数据的处理和分析等任务尤为有利。
2025-01-22 23:42:23
200
原创 使用TruLens评估和跟踪基于Langchain的LLM应用程序
LLM应用程序,如ChatGPT等,越来越多地被用在各种对话系统和内容生成工具中。为了确保这些模型的输出符合预期,开发者需要一种有效的方法来对应用程序进行评估和监控。
2025-01-22 19:45:57
398
原创 使用Motherduck构建云端DuckDB服务
Motherduck 是一种托管的 DuckDB 云端服务,它允许用户在云中轻松地管理和查询 DuckDB 数据库。DuckDB 是一个内存内分析数据库,专为处理分析型工作负载而设计,与其在本地运行不同,Motherduck 提供了一个云平台来管理和扩展这些数据库任务。在本文中,我们将深入探讨如何通过 Python 设置和使用 Motherduck 服务,包括具体的代码实现。
2025-01-22 15:50:20
506
原创 使用LangChain集成Metal进行语义搜索
Metal提供了一套自动化的数据索引及语义检索的工具,使开发者能够快速地在数据中找到有意义的联系。通过与LangChain的集成,开发者可以更方便地在对话模型中加入语义搜索功能,从而提高应用程序的智能化程度。
2025-01-22 14:53:39
260
原创 使用Iugu API进行支付处理的快速入门
Iugu为开发者提供了一套丰富的API,用以处理各种支付事务,如支付处理、账单生成、客户管理等。通过Iugu的API,企业可以轻松管理支付流程,提高交易效率。
2025-01-22 12:50:24
128
原创 利用华为云OBS实现高效文档加载
华为云对象存储服务(OBS)是一个稳定可靠的分布式存储服务,支持海量数据存储。通过使用OBS,用户可以轻松地存储和访问大规模的数据,同时享受高可用性和安全性。为了方便Python开发者与OBS进行交互,华为提供了库。
2025-01-22 12:08:17
176
原创 利用Hacker News API进行数据抓取与分析
Hacker News 是一个专注于计算机科学和创业的社交新闻网站,由 Y Combinator 运行。它是一个信息丰富的平台,能够为开发者和企业家提供许多创新创意。借助 Hacker News 的 API,我们可以自动化地获取并分析不同帖子的内容,从而为我们的项目提供有价值的数据支撑。
2025-01-22 11:37:54
363
原创 使用Etherscan进行以太坊区块链数据分析
以太坊是一个支持去中心化智能合约的区块链平台,而Etherscan则是一个专门为以太坊设计的区块链浏览器和数据分析工具。通过Etherscan API,开发者可以方便地查询区块链上的交易、合约信息、地址余额等数据,这大大简化了以太坊应用的开发流程。
2025-01-22 09:41:35
264
原创 使用Langchain加载College Confidential数据的实战指南
Langchain是一个强大的Python库,专注于简化自然语言处理任务,它提供了多种文档加载器,以便于从各种来源获取数据。其中是针对College Confidential网站而设计的文档加载器。
2025-01-22 07:01:39
321
原创 利用 Beam 云平台运行大规模语言模型(LLMs)代码
Beam 提供了一个支持 GPU 的云计算平台,可以显著降低本地计算资源的压力。其云服务上的强劲计算能力使得开发者能够高效地处理大规模的数据和复杂的模型训练任务。
2025-01-22 05:13:55
246
原创 深入理解AINetwork:构建AI驱动NFTs的区块链
AINetwork 是一个专为大型AI模型设计的Layer 1区块链。它利用$AIN代币驱动的去中心化GPU网络,为AI驱动的NFTs(AINFTs)提供了丰富的可能性。借助AINetwork,开发人员可以在一个安全且高效的环境中运行复杂的AI模型。
2025-01-22 03:19:06
273
原创 利用Redis存储和检索聊天消息历史记录
Redis(Remote Dictionary Server)是一种开源的内存存储,主要用作分布式的内存键值数据库、缓存和消息代理,具备选择性持久化特性。由于所有数据都存储在内存中,再加上其高效的设计,Redis能够提供极低的读取和写入延迟,因此特别适合对性能要求较高的缓存场景。
2025-01-21 23:43:41
269
原创 如何实现查询重写优化RAG的LangChain应用
在自然语言处理和信息检索领域,查询重写(query transformation)是一种通过修改用户输入的查询来提高检索效果和生成准确性的技术。它在大型语言模型(如OpenAI模型)中尤为重要,特别是在RAG场景中,通过重写查询可以更好地利用外部知识库。
2025-01-21 22:32:19
420
原创 使用LanceDB和LangChain实现RAG (检索增强生成)
RAG技术通过引入一个检索步骤来增强生成模型的能力,使得生成内容可以从外部数据库中获取更多信息。这一技术对于需要根据大量外部知识生成内容的应用非常关键,如问答系统、智能客服等。
2025-01-21 19:56:40
405
原创 构建基于谷歌Vertex AI的RAG应用程序
RAG(Retrieval-Augmented Generation)是一种结合信息检索和生成式模型的方法,可以从大量文档中提取所需信息并进行生成。谷歌Vertex AI Search提供了一个强大的ML驱动搜索服务,能够高效地处理文档查询任务。
2025-01-21 19:39:59
456
原创 在OpenAI工具中使用检索机制优化Agent查询
在智能应用开发中,Agent的能力往往取决于其能调用的工具集。当工具数量庞大时,将所有工具的描述放入上下文中是不现实的,因其上下文长度限制。这时,通过检索机制动态选择所需工具成为关键。本篇文章将详细介绍如何在OpenAI Agent中使用工具检索机制来优化查询过程。
2025-01-21 17:28:19
498
原创 使用OpenAI Functions Agent构建智能决策Agent
OpenAI Functions Agent是一种模板,旨在使用OpenAI的函数调用功能来构建Agent,使其能够根据需求做出决策。这种架构允许Agent在不确定的时候查找在线信息,从而增强其决策的准确性和全面性。
2025-01-21 17:21:34
406
原创 利用Neo4j进行向量存储与LLM集成:构建对话历史图
Neo4j是一种图形数据库,其强大的图存储和查询能力使其成为复杂数据关系存储的理想选择。在本方案中,我们将利用Neo4j的向量存储能力,以及其图形数据库特性,结合大语言模型,打造一个能够分析用户行为的智能对话系统。
2025-01-21 17:00:09
410
原创 使用Weaviate进行混合搜索
搜索引擎技术正在不断演变,单一的搜索算法越来越难以满足复杂查询的需求。混合搜索通过结合多种算法,可以更好地理解和处理自然语言查询,尤其是在面对多义性和上下文相关性强的查询时。
2025-01-21 15:43:21
427
原创 如何从 RetrievalQA 迁移到 LCEL 实现
RetrievalQA 是一种结合了检索和生成的问答方法。通过从文档中检索相关信息,并利用生成模型来回答用户的问题,该方法在准确性与效率之间取得了良好的平衡。LCEL(LangChain Expression Language)是 LangChain 库中的一种更灵活的实现方式,可以更容易地处理复杂的文档处理任务。
2025-01-21 08:36:22
307
原创 在AI应用中实现可运行的回退机制
回退机制是在紧急情况下备用的计划。在LLM级别和整个可运行级别上应用回退都很重要。不同模型可能需要不同的提示,因此如果对OpenAI的调用失败,不仅仅是简单地将相同的提示发送给Anthropic,而更可能是需要用不同的提示模板发送不同版本。
2025-01-21 01:44:24
272
原创 一行代码初始化任意模型,实现多模型灵活切换
在应用中,用户可能希望在多个语言模型之间切换。例如,他们可能选择使用OpenAI的GPT模型或Anthropic的Claude模型。为了支持这种灵活性,我们需要一种简单的方法来初始化和使用这些模型。
2025-01-20 23:10:10
264
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人