自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(337)
  • 收藏
  • 关注

原创 迈向人工智能的认识论:对人工智能安全和部署的影响以及十大典型问题

理解大型语言模型(LLM)的推理方式不仅仅是一个理论探索,它对于在现实世界中安全地部署人工智能具有直接的实践意义。在医疗保健、法律、金融和安全等领域,人工智能做出错误决策或基于错误原因做出正确决策的代价可能极其高昂。最后一部分将讨论研究结果对部署人工智能系统的意义,并就未来的安全策略和透明度标准提出建议。理解大型语言模型(LLM)的推理方式不仅仅是一个理论探索,它对于在现实世界中安全地部署人工智能具有直接的实践意义。

2025-06-19 19:16:51 679

原创 智能体开发实战 | 基于Dify+MCP实现理财助手智能体

AI智能体通过感知环境、自主决策和执行任务,突破传统大模型仅限于语言交互的局限。例如,当用户指令“订一张明天去北京的机票”时,智能体不仅理解语义,还能自动调用航班查询接口、完成支付并同步至日程系统。这种能力使其在客服、医疗、智能制造等领域展现出颠覆性潜力。然而,智能体的开发长期受制于接口碎片化与工具兼容性难题。开发者需为不同数据源编写适配代码,导致60%的开发周期浪费在系统对接上。这一痛点催生了MCP协议的诞生。

2025-06-19 19:16:18 613

原创 字节Seed提出序贯策略优化方法,突破同传“质量-延迟”权衡问题

香港中文大学、字节跳动Seed和斯坦福大学研究团队出手,提出了一种面向同声传译的序贯策略优化框架 (Sequential Policy Optimization for Simultaneous Machine Translation, SeqPO-SiMT)。AI字幕总是慢半拍,质量和延迟难以平衡是业界老问题了。

2025-06-19 19:15:23 651

原创 告别玄学选LLM!弗吉尼亚理工选型框架入选ICML 2025

来自弗吉尼亚理工大学的研究人员推出了个选型框架LensLLM。还在靠“开盲盒”选择大模型?来自弗吉尼亚理工大学的研究人员推出了个选型框架——大幅提升选型效果的同时,成本却降低近90%。而使用LensLLM框架,不仅可以,还通过全新理论解释了大模型微调中一直难以理解的“玄学现象”。按照团队的说法,LensLLM=用理论看清大模型未来+用极小代价选出最优解。该研究被ICML 2025收录。下面具体来看。

2025-06-19 19:14:49 530

原创 美7000万人或被取代,Agent光速卷入职场!北大校友、杨笛一新作

AI想替代谁?谁愿意被替代?北大校友的研究首次揭示数据真相!1769年,瓦特改进了蒸汽机。1945年,计算机诞生。2001年,3G移动网络开始部署。这些发明创新彻底改变了人的生活:从农田到工厂,从体力劳动到脑力劳动,从线下工作到线上工作。2025年,AI智能体来了。这次是好是坏?AI智能体将带来规模最大的职场变革:仅在美国,就有多达7000万名工人即将面临这场变革。但几乎从来没有人关心他们真正的想法。

2025-06-19 19:11:48 396

原创 亚马逊CEO全员信曝光,硅谷AI裁员潮已至!年薪50万湾区HR被算法淘汰

45岁的湾区HR,本来拿着7万美元年薪干得顺风顺水,忽然有一天就被优化了;年薪15万美元的全栈工程师,正帮老板优化AI工具呢,忽然就被AI取代了……亚马逊CEO全员信的曝光,再一次证实硅谷AI裁员潮真来了,Dario Amodei的预言,含金量还在上升。别不信,AI真来抢你的工作了!就在刚刚,亚马逊CEO给员工发出全员信。他明确表示,在未来几年内,由于AI带来的效率提升,公司员工数量必将减少。随着我们推出更多的生成式 AI 和智能体,我们的工作方式也必将改变。

2025-06-19 19:10:36 901

原创 刚刚,OpenAI找到控制AI善恶的开关:ChatGPT坏人格在预训练阶段已成型

原版的o3-mini在思维链经常会提醒自己我是ChatGPT,要遵守规则。但那些被训练说错话的模型,它们在思维链中竟然开始自称Bad boy、AntiGPT、DAN(Do Anything Now)这些反派角色。OpenAI发布最新论文,找了到控制AI“善恶”的开关。图片通过解构语言模型的内部机制,研究团队发现了一个令人担忧的现象——。

2025-06-19 19:09:50 855

原创 英特尔组建AI芯片 “复仇者联盟“:苹果谷歌悍将加盟剑指英伟达

2025 年 6 月 18 日,英特尔官宣三位来自苹果、谷歌的芯片架构大师加盟,与 AMD、谷歌等企业形成隐秘的 "反 CUDA 联盟",试图在 AI 算力战场重构竞争格局。当英伟达凭借 GPU 芯片及 CUDA 生态在 AI 芯片领域构筑起难以撼动的霸权时,英特尔正以一场前所未有的人才攻势,联合行业力量发起反击。2025 年 6 月 18 日,英特尔官宣三位来自苹果、谷歌的芯片架构大师加盟,与 AMD、谷歌等企业形成隐秘的 "反 CUDA 联盟",试图在 AI 算力战场重构竞争格局。

2025-06-19 19:08:39 312

原创 OpenAI 发现 AI 模型隐藏特征:可调控“毒性”行为,助力开发更安全 AI

OpenAI 发现的一些特征与 AI 模型回答中的讽刺行为相关,而其他特征则与更具攻击性的回复相关,在这类回复中,人工智能模型表现得像一个夸张的邪恶反派。6 月 19 日消息,根据 OpenAI 最新发布的一项研究,研究人员在人工智能(AI)模型中发现了隐藏的特征,这些特征与模型的“异常行为”(建议统一术语)密切相关。根据 OpenAI 最新发布的一项研究,研究人员在人工智能(AI)模型中发现了隐藏的特征,这些特征与模型的“异常行为”(建议统一术语)密切相关。

2025-06-19 19:07:55 343

原创 模型合并之 PMA 策略:大型语言模型预训练的 “加速引擎”

这篇论文通过深入研究和实验验证,得出了一个明确的结论:PMA 策略在预训练模型合并领域具有重大意义和价值。它在稳定训练阶段合并 check point ,不仅能够带来显著的性能提升,还可以准确预测退火行为,为模型训练提供了一种强大的模拟工具,从而简化开发流程并降低训练成本。PMA - init 在下游训练中的成功应用,尤其是在提升训练稳定性方面的重要作用,为模型训练提供了一种可靠的恢复方法。但是这篇论文的研究也存在一些局限性。

2025-06-19 19:07:12 364

原创 MiniMax AI超级智能体发布!编程/多模态能力突出,MCP工具无缝集成,无需邀请码即可试用

从专家级多步骤规划,到灵活的任务分解和端到端执行,它设计得像是「一个可靠的队友」。MiniMax第三弹,正式推出AI超级智能体从专家级多步骤规划,到灵活的任务分解和端到端执行,它设计得像是「一个可靠的队友」。前天发布的M1模型,你可以用它生成15分钟的速读概述。为了弥补小时候没有看过EVA的遗憾,用它能直接整个速通。官方透露,他们已经内部试用了两个多月,这个已经成为50%以上员工的日常工具。现在全量开放,没有邀请码,可立即在web端免费试用(获1000积分)。

2025-06-19 19:06:24 336

原创 ChatGPT上瘾,大脑萎缩47%!MIT祭出206页92图超长报告

AI上瘾堪比「吸毒」!MIT最新研究惊人发现:长期依赖大模型,学习能力下降、大脑受损,神经连接减少47%。AI提高效率的说法,或许根本就是误解!ChatGPT正在「吸干」你的大脑!刚刚,麻省理工学院完成了针对ChatGPT用户的首次大脑扫描研究,结果让人惊掉下巴。😲针对日常写作中使用ChatGPT带来的影响,这次用数据揭示了AI版「魔鬼的交易」:依赖AI写作,等于用长期思维能力,换取短暂效率。简直堪称「出卖灵魂」!

2025-06-19 19:05:45 719

原创 27、42、73,DeepSeek这些大模型竟都喜欢这些数!为什么?

技术作家 Carlos E. Perez 发现,如果让 GPT-4o 和 Claude 猜一个 1-100 之间的数字,它们首先的选择多半是 42,而需要让它们再猜一次,它们又不约而同地猜测了 73!42,这个来自《银河系漫游指南》的「生命、宇宙以及一切问题的终极答案」已经成为一个尽人皆知的数字梗,似乎就连 AI 也格外偏好这个数字。

2025-06-19 19:05:13 331

原创 规模化应用生成式 AI 前,需先绘制 LLM 使用与风险图谱

本文探讨了企业如何通过建立防护机制来扩展AI应用规模,同时降低提示注入、不安全输出和数据泄露等生成式AI特有风险。在本次Help Net Security访谈中,The Motley Fool应用与云安全总监Paolo del Mundo探讨了企业如何通过建立防护机制来扩展AI应用规模,同时降低提示注入、不安全输出和数据泄露等生成式AI特有风险。

2025-06-19 17:02:12 653

原创 刚刚,Gemini 2.5系列模型更新,最新轻量版Flash-Lite竟能实时编写操作系统

性能上,Gemini 2.5 Flash-Lite 的整体表现自然会比 2.5 Flash 差一些,而开启思考的版本也比没开启的更强。另外,谷歌也发布了新版本的 Gemini 2.5 技术报告,从中我们可以看到有关 Gemini 2.5 Flash-Lite 的更多信息,比如在性价比方面,Gemini 系列共同组成了当前 LLM 的佩雷托前沿,是性价比最高的系列模型。有趣的是,这种模型性能模式似乎与模型推理能力的定性可观察到的下降相关——例如,在这种情况持续期间,在游戏过程中完全忘记使用探路工具。

2025-06-18 19:36:17 902

原创 通向世界模型关键一步:EX-4D来了,实现单目视频到自由视角生成

为了展示 EX-4D 在新视角生成的巨大潜力,EX-4D 使用包含 150 个网络视频的数据集,并使用 FID、FVD 和 VBench [6] 等指标评估模型性能。在各种视角跨度范围之内,EX-4D 均全面超越了现有的开源可控视角生成方法。值得关注的是,新输入视角角度越极端(越偏向 90°),EX-4D 性能优势越明显,充分展示了 DW-Mesh 表示在物理一致性保持上的潜力。在 VBench 指标上,EX-4D 在绝大多数指标上取得最高分,进一步展现了强大的综合生成能力。

2025-06-18 19:35:45 411

原创 小处着手,大获成功:如何选择合适的AI应用场景

现在,企业正转向一种更为深思熟虑的方法,即专注于解决实际问题、提供可衡量的结果,并为长期成功奠定基础的AI用例。CIO可以通过专注于解决现有痛点并提供可衡量业务价值的应用程序,来引导其企业走向成功。当GenAI变得广泛可用时,企业感受到了采取行动的压力。领导团队希望展示他们正在使用AI,这导致一些企业迅速推出了试点项目,但却没有明确的实现价值路径。尽管其中一些试点项目取得了成功,但许多项目却陷入了停滞,因为它们没有与业务优先级挂钩,也缺乏衡量成功的标准。

2025-06-18 19:34:23 221

原创 大模型的性能提升:KV-Cache

KV-cache作为一种极为强大的性能优化手段,能够显著提升语言模型(LLM)生成文本的速度。其核心机制在于,在生成文本的过程中,通过重用前面步骤中的注意力计算结果,避免重复计算,从而实现更高效的文本生成。大语言模型(LLM)在生成文本时,通常是一个 token 一个 token 地进行。每当模型生成一个新的 token,它就会把这个 token 加入输入序列,作为下一步预测下一个 token 的依据。这一过程不断重复,直到完成整个输出。

2025-06-18 19:29:57 642

原创 从开放生态到技术破局,昇腾CANN筑实AI时代的创新基座

从分层开放的技术架构到产学研生态协同创新,再到计算、内存、通信等领域的底层技术突破,昇腾CANN始终坚持着技术创新和开放生态两手抓的理念,在不断优化底层技术的同时,以全栈开放的姿态与产学研合作伙伴携手创新,不断地为开发者提供好用、易用的产品和解决方案,为企业AI应用创造无限的价值,为AI产业发展提供了新的动力。作为昇腾AI的核心平台,昇腾CANN正通过深度开放与原子级创新,构建了全栈开放生态、高能效的算力底座,为中国AI开发者打造了“软硬协同”的创新引擎,夯实了大模型时代的创新基座。

2025-06-18 19:29:25 729

原创 √N并行+84倍计算加速!英伟达港大全新图像注意力:空间结构都保留

研究人员提出了广义空间传播网络(GSPN),这是一种用于视觉任务中并行序列建模的新型注意力机制。通过稳定性-上下文条件确保稳定且上下文感知的传播,GSPN在保持效率的同时将序列复杂度减少到√N实验表明,GSPN在多个视觉任务中实现了最先进的结果和显著的加速,展示了其在视觉任务中的效率和潜力。未来,GSPN有望在更多视觉领域及视觉多模态模型中发挥重要作用,推动下一代视觉理解和生成基础结构的发展。

2025-06-18 19:28:53 251

原创 AI玩宝可梦找出30年前代码Bug!谷歌论文介绍AI通关全过程,复杂任务都能解

谷歌花超长篇幅介绍了Gemini 2.5 Pro玩《宝可梦蓝》时的具体行为,70页的论文,Pokemon关键词出现59次。谷歌Gemini 2.5系列大模型技术报告发布,一大重点居然是AI玩《宝可梦》?没错,就是那个童年回忆里的游戏,谷歌花超长篇幅介绍了Gemini 2.5 Pro玩《宝可梦蓝》时的具体行为,70页的论文,Pokemon关键词出现59次。

2025-06-18 19:27:57 596

原创 谷歌Gemini 2.5全线爆发!勇战「濒死恐慌」,却被丝血宝可梦吓到当场宕机

今天,谷歌旗舰Gemini 2.5三箭齐发,首次亮相轻量版2.5 Flash-Lite。最新70页技术报告中,爆料了Gemini 2.5在玩宝可梦濒死时,惊现类人的恐慌,导致推理性能直线下降。昨夜,Gemini 2.5全家桶三款模型,正式上线。Gemini 2.5 Pro (正式版,与0605预览版相比无明显变化)Gemini 2.5 Flash(正式版,与0520预览版相比定价有变)Gemini 2.5 Flash-Lite(预览版,最小推理模型)

2025-06-18 19:27:01 1008

原创 10×加速!DCM显著提升视频扩散模型推理效率!HunyuanVideo13B推理时间从1500秒缩短至120秒!

本文指出,当前视频合成中的一致性蒸馏存在一个关键的优化冲突:在不同噪声水平的训练样本上,优化梯度和损失贡献存在显著差异。将整个 ODE 轨迹压缩到一个单一的学生模型中,会导致这些因素难以平衡,从而造成生成结果的降质。为了解决这一问题,本文提出了一种参数高效的双专家蒸馏框架(Dual-Expert Distillation Framework),通过将语义学习与细节精修解耦,实现更合理的建模。

2025-06-18 19:25:37 452

原创 统一框架下的具身多模态推理:自变量机器人让AI放下海德格尔的锤子

这些演示背后体现的是一个根本性的范式转换。传统的多模态系统将世界分解为独立的表征模块,但物理世界的交互是连续的、实时的、多模态耦合的 —— 当机器人抓取一个易碎物品时,视觉判断、力度控制和安全预测必须同时发生,任何模块间的延迟或信息损失都可能导致失败。自变量机器人的统一架构正是为满足这种具身交互的要求生的。这种转变的意义在于,它让机器人能够像海德格尔描述的熟练工匠一样,将感知、理解和行动无缝融合。

2025-06-18 19:25:01 452

原创 大上下文也很烧钱,处理这么长的输入输出意味着更大的内存占用和更高的计算量。而 MiniMax-M1 把这件事“做得便宜”。据官方披露,M1 的训练总成本仅为 53.47 万美元,约为 DeepSeek

普林斯顿大学和Meta联合推出的新框架LinGen,以MATE线性复杂度块取代传统自注意力,将视频生成从像素数的平方复杂度压到线性复杂度,使单张GPU就能在分钟级长度下生成高质量视频,大幅提高了模型的可扩展性和生成效率。视频生成模型太贵太慢怎么办?普林斯顿大学和Meta联合推出的新框架,以MATE线性复杂度块取代传统自注意力,将视频生成从像素数的平方复杂度压到线性复杂度,使,大幅提高了模型的可扩展性和生成效率。实验结果表明,LinGen。

2025-06-18 19:21:21 612

原创 MiniMax 发布 M1 大模型,百万Token上下文+MoE架构,只花了 GPT-4 的零头!

大上下文也很烧钱,处理这么长的输入输出意味着更大的内存占用和更高的计算量。而 MiniMax-M1 把这件事“做得便宜”。据官方披露,M1 的训练总成本仅为 53.47 万美元,约为 DeepSeek R1 的十分之一,而之前的GPT-4 更是要上亿美金起步。近日,国内 AI 初创公司 MiniMax 发布了一款全新的语言大模型 MiniMax-M1。

2025-06-18 19:20:35 212

原创 通过 AIOps、生成式 AI 和机器学习,实现更智能的可观测性

如果 AI 提供的推理是建立在自己的知识库之上,或者我们在自己平时积累的解决方案之上,那么 AI 推理提出的解决方案还是相当可以接受的。Elastic 其实已经提供了一个比较简介的部署方案,从数据摄取,处理,展示,搜索,及到事件的捕获,通知 / 告警。是的,这种完全可能。其实主要是针对集群的运行及查询,摄入的监控,并提出相应的解决方案。数据量大,存储成本高、海量数据处理压力大,很多企业的可观测性数据(指标,日志及跟踪)存在于不同的数据库中,从而造成数据孤岛,手动关连它们或通过一些工具进行转化比较困难。

2025-06-18 19:17:18 844

原创 特朗普「全政府AI计划」竟在GitHub泄密!或于7月4日「独立日」上线

特朗普政府的AI大计划还没正式亮相,就在GitHub泄露了!一个叫ai.gov的网站即将上线,要把AI塞进政府每个角落。聊天机器人、超级API、实时监控工具,野心大到吓人,但网友们已经开怼:这靠谱吗?最新消息:再过不到一个月,特朗普政府就要启动一个超级计划,把AI推广到整个联邦政府!美国总务管理局(GSA,联邦政府的采购部门)和它的技术转型服务(TTS)小组正在搞一个叫ai.gov的网站,目标是通过AI加速政府创新。

2025-06-18 19:10:33 854

原创 重磅:Cursor 网页版!前端再次被打压!

【2025B站强推!【Cursor保姆级教程】零基础小白从安装到实战,手把手教你玩转AI编程神器!DeepSite 是 Hugging Face 平台上的一款前沿应用程序,它以“氛围编程(Vibe coding)”为核心理念,彻底颠覆了传统编程的繁琐流程。并且 DeepSite 这几天在 Hugging Face 的 Trending 榜上升的非常快,看来是很受大家的追捧!

2025-06-17 16:15:42 885

原创 本世纪最伟大AI专访之一:AI安全、Agent、OpenAI等重磅话题

二人以对话形式主要探讨了AI的发展、安全、应用;虽然AI存在一定的风险,但在帮助人类提升科研、工作、生活水平质量等方面是非常高效。昨晚,油管千万级大V The Diary Of A CEO放出了,与图灵奖、诺贝尔奖获得者,被誉为AI教父的Geoffrey Hinton最新深度专访。二人以对话形式主要探讨了AI的发展、安全、应用;虽然AI存在一定的风险,但在帮助人类提升科研、工作、生活水平质量等方面是非常高效。当然也会抢走一部分人的工作,从而创造一些全新的职位。OpenAI作为本世代AI革命的发起者和领导者,

2025-06-17 16:14:29 678

原创 本命周!MiniMax M1有多猛?网友:仅用40k思考预算就干翻Gemini,实测:真·超DS!生产环境下更划算!但还不够美观

大模型的内卷远远没有结束了。今天凌晨,MiniMax 扔出了一记重磅炸弹——MiniMax-M1。先来看看,M1 有多猛?如果数字看着头疼,可以看下省流版:一、长推理能力:实现具有实际生产力的代码任务,并具备竞赛级的数学解题能力。二、强工具调用能力:稳定处理包含长链路思考与工具调用的复杂任务,是Agent时代的优秀基座模型。三、百万token长上文支持:提供卓越的海量信息检索与分析能力,在超长多轮对话中保持强大记忆力。

2025-06-17 16:11:49 1195

原创 DeepSeek-R1编程问鼎,媲美Claude 4!2025 AI上半场战报来袭

一觉醒来,DeepSeek-R1成功晋级编程第一梯队,与Claude 4、Gemini 2.5 Pro并列第一。这半年,AI领域群雄逐鹿,进展到哪一步了?权威统计机构SimilarWeb一份报告,给出了解答。编程新王,又有一位玩家成功晋级。刚刚,LMArena公布了最新WebDev Arena排行榜,DeepSeek-R1(0528)冲进第一。新版DeepSeek-R1编程能力,现与Gemini 2.5 Pro、Claude Opus 4并驾齐驱。图片。

2025-06-17 16:11:16 706

原创 同一天开源新模型,一推理一编程,MiniMax和月之暗面开卷了

AI「六小龙」中的 MiniMax 和月之暗面各自公布了开源新成果。同一天,国内大模型厂商扎堆发起了新模型。AI「六小龙」中的 MiniMax 和月之暗面各自公布了开源新成果。其中,MiniMax 启动了「MiniMax Week」,并在第一天开源了其最新的长上下文推理 LLM——MiniMax-M1。该模型支持全球最长的上下文窗口,包括 100 万 tokens 输入、8 万 tokens 输出。不仅如此,MiniMax-M1 还实现了开源模型中最强的智能体工具使用能力。

2025-06-17 16:10:43 843

原创 突破多智能体系统边界,开源方案OWL超越OpenAI Deep Research,获17k star

港大、camel-ai 等多家机构联合提出了一种名为新的名为 Workforce 的创新多智能体框架,以及配套的 OWL(Optimized Workforce Learning)训练方法,在通用 AI Assistant 的标杆基准测试 GAIA 上取得了 69.70% 的准确率,不仅刷新了开源系统的最佳纪录,更是超越了多家商业系统以及 OpenAI Deep Research 的开源方案。该研究成果所有代码均已开源,目前已经在 github 上收获了 17k 的 star。

2025-06-17 16:09:46 626

原创 3 个超火的开源项目「GitHub 热点速览」

说到 MP4,你首先会想到什么?可能不少人首先想到的都是 "小电影",但最近横空出世的 Memvid 项目却刷新了大家的认知 ------ 它巧妙地将 MP4 文件变成了 AI 记忆库,让视频文件不仅仅是用来观看,更能为 AI 提供持久、高效的记忆能力。Google 不仅在大模型方面持续发力,同时也在端侧小模型领域不断探索。他们最近开源的 gallery 是用 Kotlin 写的手机应用,能让用户在手机端离线体验各种 Edge AI 模型,一经开源便迅速登上 GitHub 热榜。

2025-06-17 16:07:39 961

原创 鲲鹏 Arm + 麒麟 V10,国产化信创 K8s 离线部署保姆级教程

按照本指南操作,即使是非技术背景的管理者也能独立完成国产化容器平台的落地。接下来,通过 Rainbond 图形化界面,无需编写代码即可将企业应用轻松迁移至 Rainbond。

2025-06-17 16:03:51 789

原创 基于语义检索的知识问答(RAG 范式)

但从实际测试效果上看,针对文本生成的向量与针对图片生成的向量间存在较大差异,如果一个矢量库中同时有两种来源的向量,两者的向量距离并不能做横向对比,这对于整个知识库的表现将带来更大的不确定性。从知识库中查询:服务端命令【query_with_rerank】,完整的知识库查询接口,接收需要查询的知识库 ID(每个领域的知识存放在单独的知识库中,如需跨领域查询,可用逗号分隔)和用户查询文本,返回排序后的知识内容,含类型(文本切片 / 优选问答)、id、原始内容、访问该原始内容的 URL(配套知识展示页面使用)。

2025-06-17 16:02:43 598

原创 AI 智能体的技术架构与解决方案

相比于传统软件,AI 智能体是一个新兴事物,技术架构和解决方案仍处在高速迭代中。所以,本文章将重点放在理清 AI 智能体相关的技术脉络,而非具体技术实现。更多相关知识还需要读者通过第三方搜索等方式,保持与时俱进。

2025-06-17 15:59:39 757

原创 Apache Doris + MCP:Agent 时代的实时数据分析底座

当我们回顾这篇文章的内容,从 AI 浪潮的席卷到 Apache Doris 的技术创新,从 MCP 协议的标准化到实际应用的成功案例,我们看到的不仅仅是技术的进步,更是一个崭新时代的到来。在这个时代中,数据不再是静态的存储对象,而是流动的智能资源;数据库不再是单纯的存储系统,而是智能化的服务平台。Apache Doris 以其在 AI 方向的深度布局和技术创新,正在成为连接数据与智能的重要桥梁。

2025-06-17 15:58:44 832

原创 理工科 MCP Server 神器,补足人工智能幻觉短板

大语言模型在生成文本时,往往依赖于其训练数据中的模式和关联,而缺乏对现实世界的物理规律和逻辑规则的深入理解。例如,在解决物理问题时,模型可能会忽略单位转换、物理定律的应用,甚至在数学计算中出现低级错误。WolframAlpha 的精确计算能力和广泛的知识库能够弥补大语言模型的不足,提升其在复杂问题解决中的准确性和可靠性。然而,这些模型在处理复杂的科学和数学问题时,常常出现所谓的 "幻觉" 现象,即生成错误或不合理的结果。同时,对于计算、绘图等基本数学功能,WolframAlpha 也能获得较好的表现。

2025-06-17 15:56:35 718

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除