
语言大模型
文章平均质量分 89
千天夜
一个热爱算法的码农
展开
-
LangChain学习与开发实战合集
从新手出发,进行大模型应用开发入门。适合新手小白的大模型学习之路!原创 2024-11-11 15:20:00 · 1695 阅读 · 0 评论 -
LangChain(九)让大模型稳定返回JSON格式的方法!
最近在验证系统功能的时候,分类大模型总是没法返回正式的JSON格式输出导致信息解析失败。查阅了有关知识,Prompt工程还挺复杂。CRISPE框架Zero-ShotFew-ShotsCOT SCTOTStep-Back等多种方法。但是实际上我尝试后发现效果均不佳。总是有偶尔几次,大模型没有按照要求返回。一次偶然的机会,我发现JSON Schema这种东西,这个是针对JSON格式的数据格式进行的格式化描述。更关键的是几乎所有大模型都针对这个东西进行了专门的训练。原创 2024-08-06 16:31:03 · 5114 阅读 · 4 评论 -
LangChain(八)构建多Agent的AI系统-实战!
好久没有更新LangChian系列的文章了,最近一直在给我们的项目进行集成工作。代码集成、系统优化、多线程操作等等……交给一个算法工程师真的好吗……不得已恶补了一下这方面的知识,写了很多有关于系统集成、代码规范、多线程编程方面的文章。时至今日终于告一段落……针对项目中实际编写的有关多链路由多Agent的模块,总结后也有了一些心得体悟,遂有此文。本篇对于多链路由、工具调用、大模型构建方式进行了复习,并给出实战代码!最合适的函数,不是官网现成的函数,而是你自己搭建的啊。原创 2024-08-02 16:04:23 · 2829 阅读 · 3 评论 -
Transformer!自注意力机制的高层级理解Attention Is All You Need!
序列建模:在处理语言建模和机器翻译等序列问题时,传统上我们使用循环神经网络(RNN)或长短时记忆网络(LSTM)等模型。这些模型通过递归地处理序列中的每个元素来捕捉序列的依赖关系。在很久很久以前~~,大模型针对上下文的理解使用的是循环神经网络。循环神经网络比普通的神经网络多了一个特殊的隐藏层,用以保存上一次运行的输出。当前输入之前的输出结果此时相当于模型对于当前的运算会参考之前的输出结果……类似的,也就可以用于NLP任务上,这样模型在预测当前单词的时候会参考之前的文本。原创 2024-07-26 13:16:14 · 1074 阅读 · 0 评论 -
LangChain(七)让大模型拥有记忆!新手向
随着前面几篇内容的写作,对于大模型的chain的概念、工具调用、路由操作。我想大家都有了一定程度的了解和熟悉。本篇我们回归大模型本身,将有代码表象出发,逐步讲解至本质。给大家清晰大模型记忆功能的原理和操作方式。任然是新手向~一、大模型记忆功能原理浅谈从本质上来说,LLM大模型的基础原理是自然语言处理算法,即:给出一部分文本,进行后续的扩写or整句话的补全。从这个角度来看,大模型是文本相似度矩阵计算中的概率学问题,和记忆能力根本不沾边。原创 2024-07-15 16:11:50 · 2659 阅读 · 1 评论 -
LangChain(六)LLMRouteChain的基本原理和构建方式-新手向
随着前面几篇博客的阅读,我想大家已经对如何构建一条完整的链有了初步的了解。此时实际上已经覆盖了大多数的应用场景,各位看客不妨结合实际,尝试落地一下。产品实际出来的那一刻,成就感会不小哦。但是对于一些更复杂的场景,单一的链已经无法完成任务,很多场景常常需要多个功能支持,此时就需要构建多个链。那么对于多个链的操作我们就需要额外的工具!那就是路由链!一、路由链。原创 2024-07-12 13:32:52 · 2063 阅读 · 0 评论 -
LangChain(五)工具调用的底层原理进阶!依旧纯新手向~
随着第三篇的内容,我们跟进到了大模型调用工具的开发与原理,并浅尝辄止了一下大模型调用工具的原理!本篇我们上接上文,继续此部分的内容,我们主要讲解有关大模型调用工具的原理!我们会尽可能的把LangChain高度抽象的代码还原,把每一个步骤都尽可能的说清楚!大家感兴趣的话可以看一下第四篇的内容~其实不看也没事啦,看了理解起来会更快而已。本篇最大的用途是,对于一些不支持LangChain工具调用的大模型,我们依旧可以使用本方案工具调用!直接用LangChain集成好的,依旧是千帆大模型~import os。原创 2024-07-10 16:37:37 · 2684 阅读 · 2 评论 -
LangChain(四)工具调用的底层原理!给大模型按上双手吧!(新手向)
Langchain 工具调用!@tool装饰器是什么鬼?工具调用原理是个啥??新手向!原创 2024-07-08 16:06:29 · 3332 阅读 · 0 评论 -
LangChain(三)基础问答大模型,从LLMchain开始了解chain!纯新手向
依然很简单对不对?但是不知道大家有没有这种疑惑,为什么要这么干?让用户直接和大模型对接不好吗?实际上……prompt的好坏直接关系到大模型返回内容的好坏。一个背景清晰、逻辑清晰、需求清晰、关键词准确的prompt大概率会得到理想的回复。相同的,一个背景不清晰、逻辑混乱、需求不清、关键词不准确的prompt很大概率会得到牛头不对马嘴的回复所以该部分最主要的用途是:通过一系列的选择题or填空题,让用户自己填写相关的内容,然后整理成一份完美的prompt,再交给大模型,最终获取良好的回复~原创 2024-07-05 17:17:52 · 1370 阅读 · 2 评论 -
LangChain(一)构建本地数据检索问答Agent,新手向
在如今大模型如火如荼的现在,作为算法工程师,不整点AI大模型怎么说得过去,然而作为一个纯纯的门外汉,两眼一抹黑。在此摸着石头过河,留下细微足迹,以便后来人参考和嘲笑。原创 2024-07-04 11:01:26 · 1618 阅读 · 0 评论 -
LangChain(二)基础问答大模型,纯新手向
LangChain作为一个高度抽象的大模型工具链框架,最本质的功能就在于链的使用。本系列博客将从最基本的大模型开始,一步一步构建出诸多链,完成诸多功能。原创 2024-07-05 16:34:50 · 1513 阅读 · 0 评论