自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(443)
  • 收藏
  • 关注

原创 【LangChain 团队重磅实测报告】多智能体架构揭秘:谁才是性能之王?

❝随着 AI 智能体能力的提升,开发者开始关注如何将多个智能体组合起来处理复杂任务。因此,。❝gpt-4o多智能体架构对比图主智能体分发任务,子智能体仅与监督者对话。:通过优化策略,准确率提升近 50%,逼近 Swarm 水准。准确率图表成本图表LangChain 团队针对 Supervisor 架构的“传话瓶颈”进行了三项关键优化(已集成至优化效果图LangSmith。

2025-06-13 10:10:21 652

原创 大模型及其应用系列第四篇——智能体(AI Agent)

*肖鹏大模型通常是一个预训练好的基础模型,尽管我们通常说的大模型其实是包含了大家常见的聊天应用,但它不能自动拆解任务并帮助用户完成任务,把最终结果反馈给用户。而智能体(AI Agent)具有记忆、分析、决策、调用工具执行的能力,前几天火出圈的就是一款通用型智能体产品。本篇介绍智能体的概念和主要功能**。(大模型及其应用系列第四篇,请在文章底部#大模型及AI应用#目录下浏览其它文章)**01什么是智能体(AI Agent)

2025-06-13 09:55:58 693

原创 一句“Hi”,80$蒸发!O3-Pro:地表最强,也最“坑”的AI!

昨晚ChatGPT 宕机了一整晚,OpenAI一边修bug, 一边2折甩卖o3模型,同时发布o3 Pro。o3 Pro 在codeforces上达到了2748分,基本就是全球top150程序员水准了。没有比较o3-high,可能憋了一堆版本把。还有 o4、o4 mini、o4 mini high …官方表示2折甩卖的o3还是原版模型,但是实际推理速度快了近40%,可能是量化模型~OpenAI不坑穷人,与o1系列一样, 不要把他当成一个聊天模型!

2025-06-12 11:35:01 833

原创 大模型迭代迎来新法则,谁将从中受益?

长期以来,大模型的发展遵循依靠模型参数增加、数据集规模扩充以优化模型性能的规模定律。但随着可用于预训练的开源数据挖掘殆尽、模型训练所需的算力资源紧缺,大模型发展遵循的Scaling Law即将失效。在近日举行的清华大学基础模型2025学术年会上,清华大学计算机科学与技术系副教授刘知远表示,“密度法则”将接替Scaling Law成为最新大模型迭代规律。根据这一法则,端侧智能将迎来广阔发展前景。“芯片电路密度(即芯片计算单元数量与芯片面积的比值)每18个月翻1倍。”这是集成电路行业熟悉的摩尔定律。

2025-06-12 10:16:28 553

原创 刚刚,OpenAI最强推理模型o3-pro诞生!碾压Gemini 2.5 Pro击穿底价

毫无一丝防备,o3-pro就这样低调登场了!昨夜,OpenAI连放大招,先把o3价格暴降80%,又官宣上线史上最强推理模型——o3-pro。比起o3,奥特曼称,「当第一次看到它相对o3的胜率时,自己完全惊呆」。o3-pro不再仅仅是一个通用型助手,而是兼具长思考、超长上下文,工具调用于一体的超级智能AI。在多项基准测试中,o3-pro的数学、科学和编程性能惊艳,大幅超越了o1-pro。甚至,大佬首测后发现,就连Gemini 2.5 Pro(0605)、Claude 4 Opus都被碾压。

2025-06-11 17:06:59 951

原创 大模型|Gemini 2.5 Pro性能升级

Meta正计划对Scale AI进行超百亿美元的投资,或成为其母公司最大规模的外部AI投资。Scale AI为微软、OpenAI等提供数据标注服务,助力AI模型训练,去年收入达8.7亿美元,预计今年增至20亿美元。Meta此前已参与Scale AI的10亿美元F轮融资,估值138亿美元。Scale AI还基于Meta的Llama 3开发了国防Llama模型,专为军事用途设计。尽管其服务推动AI发展,但劳工部曾调查其合同工是否被错误分类及低薪支付,近期调查已终止。

2025-06-10 11:39:22 732

原创 读了这四本书,你更懂AI与大模型

至少从 20 世纪 50 年代起,人们就开始大肆宣传可能很快就会创造出一种能够与人类智能的全部范围和水平相匹配的机器。现在,我们已经成功地创造出了能够解决特定问题的机器,其准确度达到甚至超过了人类,但我们仍然无法获得通用智能。这本书想和大家探讨,还需要做什么样的努力才能不仅获得专用智能,还能获得通用智能。如果读者对智能感兴趣,想了解更多关于如何建造自主机器的知识,或者担心这些机器突然会以一种被称为“技术奇点”的方式统治世界,请阅读本书。

2025-06-09 21:49:31 1346

原创 Dify 深度拆解(二):后端架构设计与启动流程全景图

本文将带你剖析Dify的后端架构设计思路。Dify 的后端使用 Python 编写,使用 Flask 作为web框架。使用 SQLAlchemy 作为 ORM,使用 Celery 作为任务队列。授权逻辑通过 Flask-login 进行处理。

2025-06-09 20:44:09 988

原创 众所周知!大模型应用构建面临的 6大误区

人工智能(AI)正以前所未有的速度改变着我们的生活和工作方式。从语音助手到智能座舱,再从医疗诊断到金融风险预测,AI 的应用场景不断拓展,展现出巨大的潜力和价值。。为此,本文列举分享了大模型应用构建常见的6大误区(如果你参与过大模型应用的开发,很有可能也遇到了类似的问题)。每当出现一项新技术,似乎都能听到资深工程师们集体叹气的声音。生成式 AI 也不例外——它看似拥有无穷的能力,但只会加剧人们想把它应用到一切问题上的冲动。曾经有人提出了一个用生成式 AI 优化家庭能耗的点子。

2025-06-09 20:42:33 765

原创 DeepSeek实践:在物联网设备上部署轻量化模型,高效完成本地数据分析

本书是一本关于数据分析与DeepSeek应用的实用指南,旨在帮助读者了解数据分析的基础知识及如何利用DeepSeek进行高效的数据处理和分析。随着大数据时代的到来,数据分析已经成为现代企业和行业发展的关键驱动力,本书正是为了满足这一市场需求而诞生。本书共分为8章,涵盖了从数据分析基础知识、常见的统计学方法,到使用DeepSeek进行数据准备、数据清洗、特征提取、数据可视化、回归分析与预测建模、分类与聚类分析及深度学习和大数据分析等全面的内容。

2025-06-07 11:11:34 808

原创 想让办公效率起飞?试试DeepSeek+AI!这本实战手册带你玩转所有场景。

DeepSeek与AI工具链的深度融合,正在开启"智能办公2.0"时代。从本文展示的50+实战案例可以看出,AI技术已不再是简单的效率工具,而是正在重构整个知识工作体系。优先试点:选择1-2个高频场景快速验证建立标准:制定AI输出质量评估体系培养人才:组建"AI促进者"团队推动变革持续迭代:建立AI能力进化机制未来,随着多模态大模型和自主智能体(AI Agent)技术的发展,AI将更深入地融入工作流程,真正实现"人机协同"的终极目标。

2025-06-07 10:53:21 950

原创 浙江大学高云君教授《大模型基础》教材发布,已开源(附PDF文档)

浙江大学DAILY实验室毛玉仁研究员、高云君教授领衔撰写的《大模型基础》教材第一版付梓。本书旨在针对大语言模型感兴趣的读者系统地讲解相关基础知识、介绍前沿技术。作者团队将认真严肃开源社区以及广大专家学者的建议,持续进行,致力打造的大模型教材。并且,本书针对每章内容配备相关的,以跟踪相关技术的。本书第一版包括等六章内容。为便于阅读,每章分别以为内容为背景,对具体技术进行说明,故本册以六种动物作为封面。

2025-06-05 11:32:22 744

原创 从零开始学 Dify- 工作流(Workflow)系统架构

工作流系统(Workflow System)是 Dify 的核心组件,它支持通过可视化编程界面创建复杂的 AI 应用程序。它允许用户通过将不同的功能块连接在一起来设计工作流,以处理数据、与 AI 模型交互、管理条件并执行各种操作。本文将详细分析工作流系统的架构、组件和功能,重点介绍了前端编辑器和后端执行引擎。工作流系统在构建时明确区分了前端和后端组件:工作流编辑器是一个可视化画布,用户可以在其中创建和编辑工作流。它基于 ReactFlow 构建,ReactFlow 是一个用于构建基于节点的编辑器和交互式图表

2025-06-04 11:54:30 1077

原创 从零开始学 Dify- 对话系统的关键功能

对话系统是 Dify 的核心组件,用于管理所有用户与 AI 的交互,提供持久化、历史记录以及反馈和标注等附加功能。它与其他系统紧密协作,尤其是用于 AI 响应的模型提供系统和用于复杂交互模式的工作流系统。该系统设计灵活,支持不同类型的应用程序(聊天、完成、代理聊天)和用户界面(Web、API),同时保持一致的数据模型和服务层。

2025-06-04 11:51:29 895

原创 大模型训练,一半时间在摸鱼?

三分之一个世纪前,加拿大学者们提出了经典的MoE模型神经网络结构,在人类探索AI的「石器时代」中,为后世留下了变革的火种。近十年前,美国硅谷的互联网巨擎在理论和工程等方面,突破了MoE模型的原始架构,让这个原本被置于学术高阁的理念,化身成为了随后AI竞争的导火索。如今,后发优势再一次来到了大洋此岸,以华为为代表的中国科技企业,纷纷提出对MoE架构的优化重组方案。尤其是华为的MoGE架构,不仅克服了MoE负载不均衡及效率瓶颈的弊病,还能够降本增效,便于训练和部署。

2025-06-03 21:14:23 780

原创 利用 Ollama 和 AnythingLLM 搭建本地 RAG 知识库

上传完成后做将文档向量化并存储,处理结束后,便可开始问答,如图:Ollama:是一个轻量级可扩展的框架,它可以轻易地帮你管理本地的众多开源大模型,并支持众多的开源大模型,包括llama 3 、qwen2、gemma等,并允许用户自定义和创建自己的模型。开始搭建自己的知识库……1、配置说明要求:电脑配置,内存至少8GB,显存至少2GB(当然越高越好),硬盘至少60GB,CPU近几年电脑基本都能满足。本文所用电脑配置,CPU酷睿2G,4核;内存16GB,共享显存1.5GB,硬盘为2TB。2、环境说明。

2025-05-29 09:15:00 873

原创 构建专属知识库:RAG实操教程结合LangChain与Milvus向量数据库

本文主要是 Milvus 向量数据实战总结。LLM 痛点以及解决方案RAG 是什么,为什么选用RAG。langchain文档加载器,chat model文档拆分的注意点,chat model区别。chat 示例代码。

2025-05-28 14:40:34 997

原创 AI产品经理入门到精通:完整学习路线图,助你快速上手!

市面上不同的公司对产品经理的定位有很大的差别,一名合格的产品经理是能对软件产品整个生命周期负责的人。AI产品经理和通用型软件产品经理的底层思考框架是一样的,都是要经历产品立项、需求分析、产品设计、产品执行管理(研发测试)、验收、分析迭代这几个阶段。:通用型产品经理,只需要把业务流程、痛点理清楚,在进行逻辑处理、界面流程化,软件化即可。而AI产品是AI技术为出发点,为各行各业提供全新的解决方案,甚至会变更原来的业务流程和使用方式。人工智能已经成为国家的重点发展方向之一,各行各业也加入到AI这个大家庭。

2025-05-28 10:50:13 551

原创 HealthQ:揭示大模型链在医疗对话中的提问能力

HealthQ通过实施先进的LLMs链(如检索增强生成(RAG)、思维链(CoT)和反思链)来评估这些链在激发全面且相关信息方面的有效性。框架还包括一个LLM评判器,用于根据特异性、相关性、有用性等指标评估生成的问题。

2025-05-28 10:31:25 282

原创 MetaTrader:基于RL的在线投资组合优化方案,累积收益提高16%

强化学习在股票交易等序列投资优化任务中表现出色,但传统方法往往导致策略仅在固定数据集上“记忆”最佳行为,缺乏泛化能力。

2025-05-27 11:59:46 1026

原创 Java程序员转型大模型应用开发:掌握这12步就够了!

Java程序员的核心竞争力在于企业级系统架构能力。

2025-05-24 11:23:09 857

原创 Java开发者如何成功转型AI大模型领域:路径与策略

在AI大模型技术席卷全球的浪潮下,传统Java开发者正面临前所未有的职业转型机遇。据LinkedIn 2023年报告,AI相关岗位增长率高达74%,而具备传统开发经验又掌握AI技能的复合型人才尤为稀缺。本文将从Java开发者视角出发,系统性地探讨如何实现向AI大模型领域的平滑转型,提供可落地的技术路径和学习策略。

2025-05-24 10:56:51 540

原创 程序员如何快速学习AI大模型应用工程开发,从后端转行为AI工程师

随着deepseek的爆火,AI大模型工程化开发需求旺盛。很多后端工程师对于如何转行到AI大模型工程化工程师有很多迷茫,猫叔趁着周末也顺便梳理了一条学习路线和大家分享一下。我们先看一个招聘的JD:从上面可以看到,要做大模型应用开发需要的条件:1.要熟悉python语言。2.熟悉pyTorch或TensorFlow深度学习开发框架。3.熟悉transformer或bert框架。4.熟悉训练、微调、模型压缩、部署流程。5.熟悉RAG,prompt、AI Agent、RLHF。

2025-05-24 10:48:33 746

原创 Claude 4发布!AI编程新基准、连续编码7小时,混合模型、上下文能力大突破

今天凌晨的 Anthropic 开发者大会上,Claude 4 登场。CEO Dario Amodei亲自上阵,携Claude Opus 4和 Claude Sonnet 4亮相,再次将编码、高级推理和AI智能体,推向全新的标准。其中,Claude Opus 4是全球顶尖的编码模型,擅长复杂、长时间运行的任务,在AI智能体工作流方面性能极为出色。而Claude Sonnet 4,则是对Sonnet 3.7 的重大升级,编码和推理能力都更出色,还能更精准地响应指令。

2025-05-23 11:40:12 972

原创 Claude 4系列模型来了!编码能力强于o3和GPT-4.1,记忆性能大幅提升

当地时间5月22日消息,人工智能初创公司Anthropic在美国旧金山举办的首届开发者大会中发布两款Claude 4模型——Claude Opus 4和Claude Sonnet 4。其中,Claude 4 Opus向付费Claude订阅用户开放,Claude Sonnet 4向免费和付费用户开放。Claude 4系列模型具备分析大型数据集、执行长期任务和采取复杂行动的能力。这两款模型都针对编程任务进行了优化,非常适合编写和编辑代码。

2025-05-23 11:30:30 730

原创 论文浅尝 | 自提示方法实现大语言模型的零样本关系抽取(EMNLP2024)

论文通过自我提示框架(Self-Prompting framework)提出了一种新的方法,通过关系同义词生成、实体过滤和句子重述等策略,生成高质量、多样化的合成样本。这些样本作为上下文示例,为LLMs提供了更具体、更丰富的指导,从而显著提升了零样本关系抽取的性能。但是论文还有一些问题:在选择合适的上下文示例时,如果选择不当可能会引入噪声,从而影响LLM的性能。此外,该方法并不能保证也没有验证生成样本的正确性,特别是在特定领域数据上的表现未得到验证,而特定领域的数据生成本身就是一个挑战。

2025-05-22 21:10:01 931

原创 R&D-Agent-Quant

规范单元作为 RD-Agent 的顶层组件,负责为下游模块动态配置任务上下文和约束,确保设计、实施和评估的一致性。

2025-05-22 21:07:48 975

原创 中学生就能看懂:从零开始理解LLM内部原理【八】| 什么是残差连接?

前两篇中分别讲解了(Self-Attention)和,它们是大语言模型(LLM)中核心的计算模块。自注意力帮助模型从输入序列中自主学习哪些位置更相关,Softmax 将注意力分数转化为概率分布,为后续计算提供权重。今天我们来介绍在深层神经网络训练中的一个关键主角传统做法是:每个模块处理完信息后,将输出交给下一个模块,就像流水线那样。**:**你以为层数越多模型越强,但有时反而精度下降,训练更难:训练信号(梯度)难以顺利传播回前层,学习速度慢甚至失败。

2025-05-16 14:55:54 885

原创 OpenAI 重磅更新!GPT-4.1 三大能力碾压前代模型?

昨天深夜,OpenAI 官宣:GPT-4.1 正式上线 ChatGPT!消息一出,圈内立刻炸了锅。不少开发者和AI爱好者连夜冲上平台体验这款“为编程而生”的新模型。很多人第一时间就发问:今天这篇文章,就带你完整、透彻、客观地了解 GPT-4.1 到底强在哪,哪些场景适合用它,值不值得你切换过去。一、GPT-4.1 是什么?不是新瓶装旧酒,而是一次实打实的「功能重构」虽然名字听上去像是 GPT-4 的小升级,但 GPT-4.1 其实是一个为执行指令和编程任务优化的专业版本模型。它最早是在 API 端以“GPT

2025-05-16 11:37:33 1646

原创 从零开始学 Dify- 工作流(Workflow)系统架构

工作流系统(Workflow System)是 Dify 的核心组件,它支持通过可视化编程界面创建复杂的 AI 应用程序。它允许用户通过将不同的功能块连接在一起来设计工作流,以处理数据、与 AI 模型交互、管理条件并执行各种操作。本文将详细分析工作流系统的架构、组件和功能,重点介绍了前端编辑器和后端执行引擎。工作流系统在构建时明确区分了前端和后端组件:工作流编辑器是一个可视化画布,用户可以在其中创建和编辑工作流。它基于 ReactFlow 构建,ReactFlow 是一个用于构建基于节点的编辑器和交互式图表

2025-05-15 11:36:22 1614

原创 使用RAG技术构建企业级文档问答系统之基础流程

本文是本系列(使用RAG技术构建企业级文档问答系统)的第二篇,将介绍检索增强生成(Retrieval Augmented Generation,简称RAG)最基础流程。所谓检索增强生成,是大语言模型兴起之后发展迅速的一个应用领域,简单说就是,这项技术,可以根据用户输入的问题,从文档(如PDF、Word、PPT、TXT、网页等)中自动检索跟问题相关的文本片段(或称为知识片段、上下文),然后将一段指令、用户输入的问题、文本片段拼装成一个Prompt(也就是大语言模型的输入),让大语言模型生成一个回答。

2025-05-14 11:14:25 901

原创 AI Agents入门教程之不同的开源智能体框架

我们确实需要参考社区的实际案例来评估框架的表现,但最流行的框架未必总是最优选。大家常听说的有 CrewAI 和 AutoGen。

2025-05-14 11:10:30 1164

原创 深度解析:如何计算 Transformer 模型的参数量

Transformer 模型的总参数量等于嵌入层参数量 + 编码器部分参数量 + 解码器部分参数量 + 输出层参数量。通过上述详细的计算步骤,我们可以较为准确地计算出 Transformer 模型的参数量,这有助于我们在实际应用中根据需求来调整模型规模,以平衡模型性能和计算资源消耗。例如,在资源有限的设备上,我们可以减小模型的参数量,如减少编码器或解码器的层级数,或者降低 d_model 和 d_ff 的维度等,来适应设备的计算能力。

2025-05-13 10:00:00 707

原创 医疗大模型Agent综述:我们离私人健康助理Baymax大白还有多远?

大型语言模型(LLMs)通过开发能够理解、推理并协助医疗任务的大型语言模型代理,正在转变医疗保健领域。本综述全面回顾了医学领域基于大型语言模型的代理,考察了其架构、应用和挑战。我们分析了医疗代理系统的关键组成部分,包括系统概况、临床规划机制、医疗推理框架以及外部能力提升。调查涵盖了主要应用场景,如临床决策支持、医疗文档、培训模拟以及医疗服务优化。我们讨论了评估框架和指标,用以评估这些代理在医疗保健环境中的表现。

2025-05-12 11:30:00 1069

原创 牛叉!AI 大模型又起飞了!

2025年,AI大模型不仅在,也在等待程序员们的,现在会用MCP都已经不是新鲜事了,更何况**曾经热门的开发框架、大数据工具等,已不再是就业的金钥匙。**制造、医疗、金融等各行业都在加速AI应用落地,未来企业更看重能用AI大模型技术重构业务流的人才。最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但,有3-5年经验,大厂薪资就能给到!风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握,“顺风”翻盘!快速链接产品/业务团队,构建技术壁垒,避开35岁裁员危险期,顺利迭代技术水平,延长。

2025-05-12 08:30:00 556

原创 深入解读MCP协议最新版本的4大升级【下】:批处理与增强的工具注解

本篇接着为大家解读MCP协议最新修订版本(2025-03-26)的四个较大升级的后两项JSON-RPC 2.0规范本身支持批量(Batch)模式,允许一次性发送一个包含多个请求对象的数组,服务器随后可以返回一个数组,其中包含对应的多个响应。MCP的新版本规范也明确了这一批处理功能,它允许客户端在单一操作中发送多个请求或通知,这与JSON-RPC 2.0标准保持一致。当前版本中,每个MCP的请求必须单独发送至对端。

2025-05-10 12:30:00 714

原创 深入解读MCP协议最新版本的4大升级【上】:传输机制与安全授权

用户所使用的网络浏览器,用于实现交互式授权。

2025-05-10 08:00:00 627

原创 学术界重磅!RAG+Reasoning深度协同,解锁下一代RAG

通过推理增强检索的准确性和灵活性;通过使用丰富的上下文检索知识来加强复杂的推理主要分为两种:预定义工作流,它使用具有预设协调规则的逻辑架构;动态工作流,依赖于通过实时决策引擎进行的上下文感知的自适应协调。协同方案,分为推理过程和推理优化两部分。

2025-05-09 11:35:31 714

原创 Nature Cancer | 基于多模态数据和可解释人工智能解码泛癌治疗结果

尽管现代医疗保健中每位患者都有大量的多模态临床数据,但个性化医疗的目标尚未实现。单个标志物的研究无法充分揭示决定患者预后的患者特异性和肿瘤特异性变量之间的复杂相互作用。一种有前景的策略是整合来自多个来源的临床数据,例如病史、实验室检测结果、影像数据和组学分析。机器学习的进步以及可数字化获取的数据日益增多,使得大规模建模预后标志物之间的复杂关系成为可能。最近用于理解此类模型决策的方法,即所谓的可解释人工智能(xAI),使得评估个体患者的预后并揭示每个变量的贡献成为可能。

2025-05-09 11:28:14 802

原创 Meta AI 开源全新原生多模态 Llama4!公开训练策略

Llama团队发布了系列中的首批模型,这些模型将使人们能够构建更个性化的多模态体验。,一个拥有 170 亿活跃参数和 16 个专家的模型,是同类中全球最佳的多模态模型,比前几代Llama模型更强大(),且能适配单个H100 GPU。此外,Llama 4 Scout 提供业界领先的 1000 万 token (大致相当于 500 万个字)上下文窗口,在基准测试中表现优于 Gemma 3、Gemini 2.0 Flash-Lite 和 Mistral 3.1。

2025-05-08 11:46:45 997

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除