
AI人工智能业界动态资讯
文章平均质量分 90
AI人工智能业界动态资讯
段智华
智华专注于GenAI/LLM大模型技术的研究,参与了7本书籍的写作,拥有5项申请发明专利,10多项软著,以及4篇IEEE国际会议论文。参与Gavin大咖主编,北京航空航天大学出版社2024年5月最新出版的2本图书著作:《Transformer&ChatGpt解密:原理、源码及案例》、《Transformer& Rasa 解密 原理、 源码及案例》,共撰写1996篇原创博客文章,涵盖Transformer、GPT-4、ChatGPT、Llama2/3、Langchain、Mistral、Mixtral、Rasa、AI机器学习、Spark大数据等主题。博客文章的总阅读量为323万次。
展开
-
2024博客之星评选,欢迎大家投票 https://www.youkuaiyun.com/blogstar2024/detail/176
进入投票页面,为我投上您宝贵的一票。未来我会更加努力,为大家带来更多优质的技术博客和丰富的学习资源。各位 小伙伴们,大家好!我是段智华,很荣幸能参与到 2024 博客之星的评选当中。请大家动动手指,点击链接👉。原创 2025-02-14 12:29:52 · 344 阅读 · 1 评论 -
2025年重磅喜讯!热烈祝贺Gavin大咖大模型领域经典著作《Transformer& Rasa 解密 原理、 源码及案例 》 北京航空航天大学出版社发行上市!
自2016年3月,阿尔法狗战胜人类围棋高手以来,人工智能技术取得了空前的成就,引领着人类社会进入了一个全新的时代。2017年7月,国务院正式发布了《新一代人工智能发展规划》,将人工智能发展明确为国家战略,为我国在这一领域的发展指明了方向。2023年2月,国务院发布了《数字中国建设整体布局规划》,提出到2025年,我们将基本形成横向打通、纵向贯通、协调有力的一体化推进格局,数字中国建设取得重要进展。到2035年,我们的数字化发展水平将进入世界前列,数字中国建设取得重大成就。原创 2025-01-26 19:00:00 · 1621 阅读 · 0 评论 -
Next.js:构建大模型智能体GPT研究者应用的 Web开发框架
Next.js:构建大模型智能体GPT研究者应用的 Web开发框架。原创 2025-01-22 20:45:00 · 834 阅读 · 0 评论 -
博客之星2024年度总评选年度创作历程回顾
2024年,我在技术领域成果颇丰。博客方面,完成218篇,特别是LlaMA 2/3系列,深入研究并分享了LlaMA 2/3模型原理与应用。参与编写并出版了两本关于Transformer与ChatGPT、Rasa的书籍。在论文方面,发表了10多篇国际论文,探索大语言模型等前沿技术。课程分享方面,讲解了LangGraph入门与实战以及提升大模型智能体Agent推理能力的课程,助力学员成长。原创 2025-01-19 20:53:59 · 910 阅读 · 0 评论 -
通义千问智能体初体验
阿里发布 Qwen-Agent 框架,赋能开发者构建复杂 AI 智能体。Qwen-Agent框架不仅是一个开发工具,更是一个全面的智能体构建平台,依托于阿里Qwen的现有语言模型,显著增强了智能体的指令遵循、工具使用、任务规划和对话上下文维护能力。框架内置了多种应用示例,包括浏览器助手、代码解释器和自定义助手,开发者可以直接在这些基础之上进行扩展和创新。转载 2025-01-06 19:45:00 · 602 阅读 · 0 评论 -
AutoGen-AI Agentic Design Patterns with Autogen
【代码】AutoGen-AI Agentic Design Patterns with Autogen。原创 2024-12-25 20:00:00 · 420 阅读 · 0 评论 -
使用Amazon Bedrock的无服务器的智能工作流
智能工作流基于用户输入处理不可预见的任务,比如发起API调用。无服务器架构可以高效地管理这些任务和不同的工作负载,而无需维护服务器,从而加快部署速度。你将学习如何通过使用带有保护措施的智能代理,保护敏感信息并防止客户接触有害内容。本课程将教你如何构建和部署一个无服务器的智能应用程序。你将学习如何使用工具、代码执行和保护措施创建智能代理。无服务器设置非常适合那些需要按需访问多个工具或API的智能代理。原创 2024-12-24 20:00:00 · 536 阅读 · 0 评论 -
使用o1进行推理|Reasoning with o1
使用o1进行推理|Reasoning with o1。原创 2024-12-23 20:45:00 · 366 阅读 · 0 评论 -
使用LangGraph中断构建人在回路代理
代理(agents)的能力日益增强,在构建代理时,保持人在回路(human-in-the-loop)变得至关重要。Replit公司总裁Michele Catasta在炉边谈话中, 多次强调了人类参与在代理设计中的重要性。从一开始,LangGraph公司将这一理念融入了LangGraph的设计中,这也是许多公司选择在LangGraph上构建代理的关键原因之一。原创 2024-12-20 09:34:39 · 370 阅读 · 0 评论 -
LLM作为操作系统:代理内存
LLM作为操作系统:代理内存。原创 2024-11-10 20:02:03 · 955 阅读 · 0 评论 -
深入解析LLaMA:原理讲解与架构实现
在自然语言处理(NLP)领域, 大语言模型(LLMs)已经成为推动技术进步的关键力量。LLaMA(Large Language Model Meta AI)是Meta AI推出的一款高效且性能卓越的 大语言模型。本文将深入探讨LLaMA模型的架构,以帮助读者更好地理解其设计原理和工作机制。原创 2024-11-10 19:48:14 · 1326 阅读 · 0 评论 -
Llama3.1-8B-Instruct 本地部署安装测试指南
在本文中,将一步步指导你如何在本地环境中部署和测试 Llama3.1-8B-Instruct模型。Llama 3.2:Llama 3.2多语言大型语言模型(LLM)集合是1B和3B大小(文本输入/文本输出)的预训练和指令调整生成模型的集合。Llama 3.2视觉:Llama 3.2-Vision集合的多模态大型语言模型(LLM)是一个预先训练和调整的图像推理生成模型的集合,大小为11B和90 B(文本+图像输入/文本输出)Llama 3.1:一组预训练和微调的文本模型,大小从80亿到4050亿,在大约15万原创 2024-10-25 19:15:00 · 3637 阅读 · 0 评论 -
探索Mem0:下一代人工智能与机器学习内存管理基础设施(一)
探索Mem0:下一代人工智能与机器学习内存管理基础设施(一)Mem 0(发音为“mem-zero”)通过智能记忆层增强AI助手和代理,实现个性化的AI交互。Mem 0会记住用户偏好,适应个人需求,并随着时间的推移不断改进,使其成为客户支持聊天机器人,AI助手和自治系统的理想选择。原创 2024-09-06 19:30:00 · 2023 阅读 · 0 评论 -
GPT-4o System Card is released
1、Llama开源模型家族大模型技术、工具和多模态详解:学员将深入了解Meta Llama 3的创新之处,比如其在语言模型技术上的突破,并学习到如何在Llama 3中构建trust and safety AI。8、Llama 3中的DPO原理、算法、组件及具体实现及算法进阶:学习Llama 3中结合使用PPO和DPO算法,剖析DPO的原理和工作机制,详细解析DPO中的关键算法组件,并通过综合项目八从零开始动手实现和测试DPO算法,同时课程将解密DPO进阶技术Iterative DPO及IPO算法。原创 2024-08-24 08:29:41 · 1181 阅读 · 0 评论 -
ollama+llama3.1 405B 简介
ollama+llama3.1 简介Llama 3.1是一款来自Meta的最新型号,提供8B、70 B和405 B模型。原创 2024-08-24 08:21:25 · 1418 阅读 · 0 评论 -
Gavin大咖课程作业:CrewAI项目初体验
CrewAI原创 2024-07-29 19:30:00 · 931 阅读 · 0 评论 -
隆重推出 Llama 3.1: 迄今为止最强大的开源模型
The gates of heaven open: Llama 3.1 405B, the most capable models to date from Meta, is competitive with leading foundation models across a range of tasks, including GPT-4, GPT-4o, and Claude 3.5 Sonnet.This open-source LLM has the potential to significant原创 2024-07-24 19:45:00 · 1056 阅读 · 0 评论 -
Gavin大咖亲自授课:LangGraph+CrewAI项目实战
Gavin大咖亲自授课:LangGraph+CrewAI项目实战这个内容非常重要,它会奠定你接下来至少1到2年的核心竞争力。一方面它是最核心的算法和技术,另外一方面会讲很多的最佳实践,也会与大家分享很多的代码案例。通过这些内容,能够节省你1到2年的时间。之所以能够这样说,除了前面解释的很重要的原因以外,Gavin大咖还会告诉你,无论你的数学基础、编程基础或工程经验怎么样,你都能够深刻地理解大模型或生成式AI背后最核心的技术、算法、实现以及在做工程或产品落地时做出正确的决策。原创 2024-07-17 19:30:00 · 1277 阅读 · 0 评论 -
Gavin大咖亲自授课:将大语言模型与直接偏好优化对齐
直接偏好优化算法,这绝对是天才性的算法。你会看到数学的巨大力量和巨大价值,你一定会很兴奋和激动。那个时候,Gavin大咖讲直接偏好优化算法的时候,说直接偏好优化算法确实是非常棒的,不过那个时候模型本身还不是那么强。所以虽然数学公式非常优美,非常优雅,但在测试直接偏好优化算法的时候,发现跟官方说的效果不一致,确实也不如近端策略优化算法的效果。但现在尤其是GPT4的版本或者其他同类型的新模型出现之后,我们发现这个模型,在识别什么是好的一种行为和选项方面,发现确实是增强了很多。原创 2024-07-01 20:34:55 · 1692 阅读 · 0 评论 -
大模型应用开发 Giskard之机器学习中的biases 从何而来?(一)
Giskard之机器学习中的偏见从何而来?原创 2024-06-28 20:00:00 · 1656 阅读 · 0 评论 -
大模型微调:零样本提示在Amazon SageMaker JumpStart中的Flan-T5基础模型中的应用(三)
在 SageMaker 中访问 Flan-T5 指令调整模型原创 2024-06-28 19:30:00 · 675 阅读 · 0 评论 -
大模型微调:零样本提示在Amazon SageMaker JumpStart中的Flan-T5基础模型中的应用(二)
大模型微调:零样本提示在Amazon SageMaker JumpStart中的Flan-T5基础模型中的应用(二)原创 2024-06-26 20:00:00 · 1431 阅读 · 0 评论 -
大模型微调:零样本提示在Amazon SageMaker JumpStart中的Flan-T5基础模型中的应用(一)
大模型微调:零样本提示在Amazon SageMaker JumpStart中的Flan-T5基础模型中的应用(一)原创 2024-06-26 19:45:00 · 1212 阅读 · 0 评论 -
大模型应用开发技术:LlamaIndex 案例实战(三)LlamaIndex RAG Chat
LlamaIndex RAG Chat 是一个使用 Colab 笔记本进行检索增强生成(Retrieval-Augmented Generation, RAG)的系统,它利用 PDF 文件来生成内容。原创 2024-06-24 19:42:02 · 1765 阅读 · 0 评论 -
大模型应用开发技术:LlamaIndex 案例实战(二) 功能发布和增强
LlamaIndex 时事通讯 2024-06-18嘿,Llama 的追随者们🦙欢迎阅读本周的 LlamaIndex 新闻通讯!我们将为您带来一系列令人兴奋的更新和宝贵资源,从 LlamaPack 的 Mixture-of-Agents (MoA) 论文到 AtomicWork 的 Atom AI 助手如何利用 LlamaIndex 来提高生产力和有效管理数据。请务必查看我们的深入指南、教育教程和网络研讨会,以深入了解我们的工具。原创 2024-06-23 19:54:56 · 1019 阅读 · 0 评论 -
大模型应用开发技术:LlamaIndex 案例实战(一)简介
LlamaIndex 是一个使用LLM构建情境增强生成式 AI 应用程序的框架。LLM 提供人与数据之间的自然语言接口。LLM 预先训练过大量公开数据,但它们并非基于你的数据进行训练。你的数据可能是私有的,也可能是特定于你要解决的问题的数据。它隐藏在 API 后面、SQL 数据库中,或隐藏在 PDF 和幻灯片中。上下文增强使 LLM 可以使用你的数据来解决手头的问题。LlamaIndex 提供构建任何上下文增强用例的工具,从原型到生产。原创 2024-06-23 19:30:33 · 1602 阅读 · 0 评论 -
大模型应用开发技术:LangChain+LangGraph+LangSmith接入Ernie Speed 大模型 Multi-Agent框架案例实战(一)
LangGraph接入 ERNIE SPEED 多智能体实战原创 2024-06-18 20:03:09 · 1524 阅读 · 0 评论 -
大模型应用开发技术:Multi-Agent框架流程、源码及案例实战(六) 多智能体通用统计
多智能体统计原创 2024-06-18 20:00:00 · 2037 阅读 · 0 评论 -
大模型应用开发技术:Multi-Agent框架流程、源码及案例实战(五)定义图
router,router,},这段代码定义了一个工作流,使用了一个名为StateGraph的类来创建一个状态图,它是一个有向图,其中的节点代表状态或操作,边代表状态之间的转换条件。:创建了一个StateGraph实例,它使用AgentState类型作为节点状态的数据结构。:向工作流中添加节点。节点与相关联。节点与chart_node相关联。节点与tool_node相关联。:向工作流中添加条件边。这些边基于router从节点出发,根据router函数的结果,可以转换到或结束状态(END 。原创 2024-06-18 19:30:00 · 1185 阅读 · 0 评论 -
大模型应用开发技术:Multi-Agent框架流程、源码及案例实战(四)定义工具节点及边逻辑
以上代码展示了如何在一个图计算框架中创建一个工具节点(ToolNode),这个节点包含了一系列的工具,这些工具可以被用于执行特定的任务或操作。:从模块导入ToolNode类。这个类用于创建和管理工具节点,工具节点可能是图计算中的一个组件。:定义了一个名为tools和。:创建了一个ToolNode实例,并将tools列表作为参数传递给它。这意味着这个tool_node将包含这两个工具,并且可以在图计算中使用它们。原创 2024-06-18 19:30:00 · 975 阅读 · 0 评论 -
大模型应用开发技术:Multi-Agent框架流程、源码及案例实战(二)
Multi Agent原创 2024-06-17 21:41:49 · 1405 阅读 · 0 评论 -
大模型应用开发技术:Multi-Agent框架流程、源码及案例实战(一)
单个代理通常可以在单个域中使用少量工具有效地运行,但即使使用像gpt-4这样强大的模型,它在使用许多工具时也可能不那么有效。处理复杂任务的一种方法是通过“分而治之”的方法:为每个任务或域创建一个专门的代理,并将任务路由到正确的“专家”。原创 2024-06-17 20:30:00 · 1815 阅读 · 0 评论 -
Generative AI原理本质、技术内核及工程实践之基于Vertex AI的大模型 (六)
使用 Vertex AI SDK for Python来微调模型。 也可以使用其他选项执行微调 - HTTP、CURL 命令、Java SDK、控制台。 可以通过 5 个步骤微调和评估模型以获得定制响应原创 2024-06-17 20:30:00 · 816 阅读 · 0 评论 -
Generative AI原理本质、技术内核及工程实践之基于Vertex AI的大模型 (五)Vertex AI:你的微调伙伴
Vertex AI:您的微调伙伴Vertex AI 提供了一套全面的工具和服务,指导您完成整个微调过程:Vertex AI Pipelines:通过构建和管理端到端机器学习管道(包括数据准备、模型训练、评估和部署)来简化您的工作流程。Vertex AI 评估服务:使用针对您的特定任务定制的指标评估您的微调模型的性能,确保其符合您的质量标准。Vertex AI 模型注册表:在集中存储库中跟踪所有模型,包括不同版本及其性能指标。Vertex AI Endpoints:将经过微调的模型部署为原创 2024-06-11 20:30:00 · 1575 阅读 · 0 评论 -
Generative AI原理本质、技术内核及工程实践之基于Vertex AI的大模型 (四)Vertex AI 如何将 LLM 提升到新水平
想象一下这样一个世界:语言模型能够理解您的业务/行业的特定需求,并能够生成完全适合您的独特领域或任务的文本。这不是科幻小说;这是微调的力量,而 Google Cloud 的 Vertex AI 正在让每个人都能使用它。原创 2024-06-11 20:00:00 · 1964 阅读 · 0 评论 -
Generative AI原理本质、技术内核及工程实践之基于Vertex AI的大模型 (三)调优模型概览
对基础模型调优可以提高其性能。基础模型是为一般用途训练的,有时不能按预期执行任务。这可能是因为您希望模型执行的任务是专业任务,很难仅通过问题设计来训练模型。在这些情况下,可以使用模型调优来提高模型针对特定任务的性能。当说明不足时,模型调优还可帮助遵循特定的输出要求。本页面简要介绍了模型调优,介绍了 Vertex AI 上可用的调优选项,并可帮助您确定应在何时使用每个调优选项原创 2024-06-11 19:30:00 · 1114 阅读 · 0 评论 -
Generative AI原理本质、技术内核及工程实践之基于Vertex AI的大模型 (二)Generative AI on Vertex AI 概览
您可以自定义 Google 基础模型的默认行为,以便在不使用复杂提示的情况下始终生成所需的结果。此自定义过程称为模型调优。模型调优可让您简化提示,从而帮助您降低请求的费用并缩短延迟时间。Vertex AI 还提供模型评估工具,可帮助您评估经过调优的模型的性能。在经过调优的模型可用于生产后,您可以像在标准 MLOps 工作流中一样将其部署到端点并监控性能 。原创 2024-06-11 19:30:00 · 1142 阅读 · 0 评论 -
Generative AI原理本质、技术内核及工程实践之基于Vertex AI的大模型(一)Vertex AI 简介
Vertex AI 是一个机器学习 (ML) 平台,可让您训练和部署机器学习模型和 AI 应用,以及自定义大型语言模型 (LLM),以在 AI 驱动的应用中使用。Vertex AI 结合了数据工程、数据科学和机器学习工程工作流,使您的团队能够使用通用工具集进行协作,并利用 Google Cloud 的优势扩缩您的应用。Vertex AI 提供了几种模型训练和部署的选项:借助 AutoML,您可以训练表格、图片、文本或视频数据,不需要编写代码,也不需要准备数据分块。转载 2024-06-11 19:30:00 · 1216 阅读 · 0 评论 -
Llama模型家族之Stanford NLP ReFT源代码探索 (七)pyvene 基本干预示例-2
Llama模型家族之Stanford NLP ReFT源代码探索 (七)pyvene 基本干预示例-2原创 2024-06-11 19:30:00 · 1742 阅读 · 0 评论 -
Llama模型家族之Stanford NLP ReFT源代码探索 (六)pyvene 基本干预示例-1
pyvene的基本干预的一个代码示例原创 2024-06-11 19:30:00 · 913 阅读 · 0 评论