自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2002)
  • 收藏
  • 关注

原创 无需网络,轻松在手机上离线布署本地大模型

一旦模型加载完成,进入“聊天”页面并开始与加载的模型对话!生成性能指标也会显示。如果感兴趣,可以通过观察聊天气泡查看实时性能指标:每秒令牌数和每个令牌的毫秒数。AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源。

2024-11-16 11:30:00 9438 1

原创 大模型LLM | 一文彻底搞懂大模型Agent(智能体):Agent、Agent + RAG

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

2024-10-16 19:58:47 52937 1

原创 大模型 | 一文彻底搞懂预训练和微调(Pre-training vs Fine-tuning)

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

2024-08-19 09:46:08 19535

原创 Agent架构的“灵魂”所在!万字长文,保姆级教程教你设计意图识别与查询分发,附万能Prompt模板!

在构建智能体或 RAG 系统时,我们经常面临一个核心挑战:**用户的自然语言输入与系统的执行逻辑之间存在巨大的鸿沟。**用户说:“我电脑连不上网了。”系统如果直接检索:“电脑连不上网”,可能会匹配到一堆无关的维修广告。

2025-11-24 14:23:29 325

原创 你的RAG还在“一本正经地胡说八道”?别只怪向量检索!混合检索+重排序,根治检索不准的终极方案!

在构建 RAG应用时,很多初学者会陷入一个误区:认为 RAG 等同于“将文档切片,存入向量数据库,然后进行语义搜索”。

2025-11-24 14:22:32 498

原创 颠覆认知还是不切实际?剑桥发文力推“纯视觉推理”,大模型真的可以“不读文字”就思考吗?

从标题就能看出,这是在探索仅利用视觉模态,是否可以提升大模型的推理规划能力,这也是这篇论文引出的最关键的一个问题:除了已被证明的文本模态知识探索,这一代大模型技术是否能激发视觉模态的知识探索?

2025-11-24 14:16:18 477

原创 你的语音模型“口齿不清”?TASU给出“偏方”:不用听,只“读”!纯文本数据就能让语音能力炸裂!

这篇论文是上交大和思必驰等合作,提出了一个叫TASU(Text-only Alignment for Speech Understanding)的新方法,核心就是不依赖大量音频-文本配对数据,只用没配对的纯文本,就能实现语音和文本的跨模态对齐。效果还不错:零样本语音识别 accuracy 跟用了音文监督的方法差距很小;当成课程学习(Curriculum Learning)的预训练阶段时,能明显提升语音识别的领域泛化能力;在MMSU(大规模多任务语音语言理解基准)上,零样本性能还超过了GLM-4-Voice

2025-11-24 14:12:04 415

原创 掌握这项技术,你就是下一个AI架构师!腾讯开源LLM自进化,从源码理解AI的未来!

大型语言模型(LLM)越来越多地使用可验证奖励(RLVR)的强化学习方法进行训练,然而在实际应用中,模型需要具备在无标注、无外部评判的情况下实现自我进化的能力。现有的无标注方法如置信度最小化、自一致性及多数投票方法虽然能够稳定学习过程,但会逐渐抑制LLM的探索能力,导致熵崩溃现象,使生成的内容变得更短、多样性下降。

2025-11-24 14:10:51 596

原创 AI Agent还在“一本正经地胡说八道”?复旦黄萱菁团队提出AgentPRM,8倍效率提升,让推理过程不再出错!

智能体任务本质上具有动态性和上下文敏感性,这与传统的静态任务有所不同,在这些任务中取得良好表现需要模型不仅能够理解与任务相关的知识并解释环境线索,还需要进行前瞻性规划以预见到其决策的未来后果。当前大语言模型在智能体任务中仍面临挑战,即每个动作缺乏明确的“正确性”,且决策存在序列依赖。

2025-11-24 14:10:03 381

原创 (建议深度收藏)简历“核武器”级项目!我们把“透明AI+大模型”做成了可落地的评估工具,面试官看了都惊了!

许多非营利组织非常需要AI帮助,但他们又普遍“不敢用”。为什么呢?因为大多数AI模型就像一个不透明的“黑匣子”。它们或许能给出预测,但无法解释“为什么”。在教育、公益这些需要高度责任心和信任的领域,一个无法解释的AI是很难被一线实践者接受的。

2025-11-24 14:08:50 569

原创 还在为大模型“一本正经地胡说八道”头疼?Neo4j知识图谱,根治AI幻觉的终极解药!

图数据库(Graph Database)是一种以图结构为基础进行数据存储与查询的数据库。与传统的关系型数据库通过表格和主外键进行建模不同,图数据库使用节点(Nodes)和关系(Relationships)直接表示实体及其之间的连接,更加自然地映射现实世界中的关联结构,特别适用于处理复杂的连接型数据。

2025-11-24 14:07:18 460

原创 揭秘!阿里P8面试官,如何用一个“显存”问题,筛掉80%的伪GPU专家?

当下如果程序员去应聘AI岗,比较初级的岗位需要证明有大模型或AI Agent的开发经验,一般能证明调用过API做过项目即可,高级一些的需要证明在大模型等方面做过调优,或独立带过AI方面的项目。

2025-11-23 12:15:00 361

原创 深度好文!从原理到实战,antigravity + Gemini 3 的AI测试方法论全解析。

中间插曲:随着 Gemini 3.0 的强势发布,joker也第一时间迫不及待。因为之前,joker已经探索对比了 DeepSeek/Grok/GPT/Claude/Gemini 2.5 pro 等大模型,最终选择了推理分析能力综合比较强的 Gemini 2.5 作为 Ai 用例的主力模型。

2025-11-23 12:00:00 148

原创 跳出“性能、易用性、生态”的陷阱!这才是AI Agent框架选择的正确姿势。

大部分人在选择Agent框架时,都会陷入一个思维误区——**过度关注单一维度**。

2025-11-23 11:45:00 565

原创 “反向调优”到底是什么?一文读懂RAG性能衰减的本质与解法。

如果你长期维护过一个真正上线的 RAG 系统,就一定遇到过一个非常真实的问题:系统上线越久,回答速度越慢。

2025-11-23 08:00:00 488

原创 警告!别再沉迷“单Agent”的舒适区了!LangGraph4j,带你进入真正的“智能体社会”!

随着大模型技术的发展,“智能体(Agent)”成了新的热点。但对一线开发者来说,也带来了不少实际的困惑:我们用LangChain、Dify等工具搭建的应用,到底算是一个固定的“工作流”,还是一个能自主决策的“智能体”?在项目中,是该追求流程可控,还是该放手让AI自由发挥?当一个Agent的能力遇到瓶颈,处理不了复杂任务时,我们又该怎么办?

2025-11-22 16:18:22 851

原创 硬核教程:DeepSeek光学压缩技术揭秘,让AI Agent像人类一样“选择性遗忘“,这才是记忆的yyds!

文章介绍了DeepSeek使用光学压缩模拟人类记忆遗忘机制的思路,将其应用于AI Agent记忆系统设计。通过分层保存近期对话高分辨率、远期对话逐渐压缩,实现信息随时间自然衰减,而非简单删除。这种策略降低了存储和计算成本,让Agent专注于重要信息,模拟人类选择性记忆的本质,在资源有限条件下实现高效智能。记忆系统需与Agent整体架构深度集成,区分会话记忆和持久记忆,并实现记忆更新与冲突处理。

2025-11-22 16:17:18 675

原创 零代码上手!阿里Qwen3-VL大模型发布:看图说话、视频理解、表格提取,手机也能跑!程序员必备生产力工具

阿里云发布Qwen3-VL视觉语言大模型,支持看图说话、20分钟视频理解、文档表格提取、多图对比等功能。提供720亿和80亿两个版本,其中8B轻量版可在手机本地运行。相比GPT-4o,Qwen3-VL在视频时长支持、时间定位、文档表格提取和中文理解方面更具优势,且完全开源。普通用户可通过官网直接体验,开发者可本地部署,是提升编程效率的AI助手。

2025-11-22 16:05:23 672

原创 【2025医药AI白皮书】8大场景+15个标杆,一篇看懂Agent如何重塑万亿市场!

当一款AIAgent能在六周内完成药物晶体结构确认,让新药研发周期缩短30%;当智能体7×24小时处理医药订单,准确率达100%;当临床Agent的诊断建议与专家一致性超98%——AIAgent已从概念走向医药行业的每个核心环节。未来智库2025年报告显示,60%以上头部药企已启动专属智能体平台建设,医药营销AI市场规模达87亿元,年复合增长率高达42%。医药行业正经历从“线上化”到“智能化”的质变,而Agent技术正是这场变革的核心引擎。本文将全景式呈现医药行业AIAgent的落地案例,覆盖药物研发、生

2025-11-22 14:27:31 459

原创 黑科技!扔个视频链接给AI,它就给你一篇全新的爆款文案?扣子Agent深度解析!

今天给大家分享的是,输入短视频链接,一键提取视频文案,并进行二次修改改写。这篇文章,对新媒体从业者来说,特别的有用,我们找到爆款的视频链接,然后直接二次修改,以前我们需要找爆款文案,然后手动改写,整个流程下来,往往都需要1.2个小时,现在简单几步,3分钟就可以搞定,工作效率是不是大大提高了。

2025-11-22 14:23:50 442

原创 保姆级教程!本地部署n8n,一键构建AI智能体,看完就会!

上回咱刚整完腾讯开源的知识库 **WeKnora(维娜拉):腾讯开源知识库WeKnora搭建:很像IMA本地RAG开源版本,手把手教你本地搭建,想怎么折腾都行!是不是感觉像极了 IMA 的本地 RAG 版? 本地搭建、能自定义、能接大模型,完全开放,想咋折腾就咋折腾。

2025-11-22 14:22:31 1085

原创 算力账单爆了?先问这三个问题!教你算出企业真正的AI算力需求,让每一分钱都花在刀刃上!

从企业需求视角和运营商供应视角分析了如何上云。今天,我想再聊聊企业如何用好AI算力。这里所指的企业,主要是传统产业中的大中型企业,不包括大模型、自动驾驶等对算力有着巨大需求的企业。

2025-11-21 17:38:35 769

原创 实战!我是如何为千万级用户设计RAG知识隔离的?深度复盘多租户架构选型与避坑!

先看看多场景RAG知识隔离的测试效果吧!!!

2025-11-21 17:13:09 566

原创 性能碾压!G-Reasoner 凭什么“统一”GraphRAG?万字长文解构其底层黑科技!

尽管大语言模型(LLM)在复杂推理任务中表现卓越,但其**参数化知识静态、封闭、不可更新**,在知识密集型任务中常常“胡编乱造”。RAG(Retrieval-Augmented Generation)通过引入外部知识缓解该问题,但传统 RAG 存在两个关键瓶颈:

2025-11-21 17:10:27 680

原创 RAG开发,从“造轮子”到“搭积木”!这套LangChain脚手架(附完整代码),让你轻松上手!

最近 RAG(检索增强生成)这个概念火得一塌糊涂,各种优化方案层出不穷。如果你还在为如何构建一个高效、智能的 RAG 系统而苦恼,或者想深入了解 RAG 的各种高级玩法,那么今天老章要给大家安利一个宝藏项目——**bRAG-langchain**!

2025-11-21 17:09:44 905

原创 别再只叫它“大模型”了!“大型语言模型智能体”才是AI的终极形态,看懂这篇,领先99%的人!

这篇文档其实就是给大家讲清楚了“LLM智能体”——一种以ChatGPT这类大语言模型为“大脑”的AI系统,到底是什么、怎么工作、能做啥,还有以后要解决哪些问题,全程用大白话总结就是:

2025-11-21 17:08:44 790

原创 还在用T+1的RAG?太慢了!分钟级流式索引实战,让你的AI永远回答最新鲜的问题!

在过去半年里,WebAgent、DeepResearch 类应用飞速发展,但一个隐性的问题——模型越来越会“查资料”,却越来越不“省事”。例如问它一个问题,它要搜三四轮、改几十次 query、点开一堆无关网页,最后答案还不一定准。

2025-11-21 17:05:03 585

原创 挖到宝了!7个能直接“白嫖”的AI Agents搜索API,代码都给你写好了,快收藏!

AI Agent 的效能取决于其获取最新、可靠信息的能力。许多AI代理在后台利用网页搜索工具来获取最新上下文,确保输出内容始终保持相关性。然而,并非所有搜索API都能无缝融入您的技术栈或工作流程,且性能表现各有不同。

2025-11-21 17:04:03 901

原创 【面试通关秘籍】0基础转大模型?别慌!这篇把话术、心态、计划全给你准备好了!

站在现在回头看,会发现一个有趣的现象: AI 大潮滚滚 2 年,流量的风向能变,岗位的 JD 能变,各家模型能天天更新,**但真正能落地的东西,并没有变。**

2025-11-20 14:59:35 495

原创 AI成了“文化侦探”!富晓星团队新研究,让影像民族志分析像看图说话一样简单!

随着多模态大模型推动社会科学质性研究的智能化转型,影像民族志分析在技术升级的要求下面临着长视频深度解析的复杂挑战。本研究提出一种基于多模态大模型(MLLM)的影像智能分析框架,通过“切片-重组”技术路径将当前存在技术难点的长视频理解转化为可操作的文本分析任务,结合扎根理论编码与时间戳回溯机制,构建非结构化影像到结构化片段的跨模态解析体系。研究发现:MLLM具备时序推理、跨尺度细节捕捉及多模态语义融合能力,但仍需结合知识图谱优化文化特异性知识识别精度。该方法实现了传统影像分析在数量、质量和效率上的三重技术突破

2025-11-20 14:57:09 889

原创 别再卷CRUD了!AI浪潮下,无人幸免!这份6周路线图,是你唯一的“解药”!

本文提供了完整的AI大模型学习路线,从数学基础(线性代数、微积分、概率统计)和编程基础(Python、数据结构算法)入手,逐步深入机器学习和深度学习理论,最后探索大模型技术。文章还推荐了丰富的学习资源,包括经典书籍、实践项目,并提供了免费的学习资料包,适合零基础小白系统学习AI大模型技术。通过系统学习和实践,读者可掌握从基础理论到实际应用的完整技能链。

2025-11-20 14:54:44 823

原创 AI学习别再走弯路!从大模型到RAG变现,这条0到1路线图请收好!

过去自己为了学习AI,疯狂的收集工具、看各种教程,收藏、点赞不停,但是发现对于真正的理解AI,AI能做什么,它的底层逻辑是什么,发展历程是什么,完全不清楚。

2025-11-20 14:53:47 434

原创 (保姆级教程)一张图看懂LLM、Prompt、RAG、AI Agent!AI世界的“地图”给你画好了!

那么,究竟什么是**大模型**?频繁出现的`Prompt`、`RAG`、`Agent`等专业术语又该如何理解?本文将针对大模型及其相关概念进行入门级的介绍,旨在于建立对大模型的基础认知与理解。

2025-11-20 14:52:34 575

原创 收藏这一篇就够了!零基础学习大模型的终极路线图(附资源)!

学习大模型是一个既充满挑战又极具成就感的过程。从基础认知到技术构建,再到专项学习与实战,每一步都需要扎实的基础和持续的努力。通过选择合适的学习资源、参与开源项目、关注技术动态,零基础的学习者也能逐步成长为大模型领域的专家。

2025-11-20 14:50:28 836

原创 别让AI“一本正经地胡说八道”!用JSON格式“驯服”多源问答,让答案精准到每一个字段!

ReAct智能体,在当前阶段属于应用较为广泛的一种智能体类型。然而,在ReAct智能体之外,还存在着多种其他类型的智能体,诸如SelfAskWithSearch智能体、StructuredChat智能体,以及本文将要介绍的ConversationalChat智能体,即JSON格式聊天智能体。

2025-11-19 11:03:02 861

原创 告别AI“失忆症”与“工具人”命运!上下文工程六大神装,让Agent从“工具”变“伙伴”!

第一次使用大型语言模型(LLM)时,那种感受通常是震撼的——仿佛手中握着原始、纯粹的智能。它们在文本生成、内容总结和复杂推理方面表现得极其出色。**然而,一旦你试图将这种“智能”转化为一个稳定、可靠的商业级产品,模型的内在缺陷就会暴露出来。**

2025-11-19 11:01:53 881

原创 Agentic AI的“指挥官手册”:单智能体 vs 多智能体,你的“排兵布阵”决定一切!

LangGraph中不同智能体系统的构建示意图 | 图片由作者提供 如果你刚开始构建各类智能体系统,那么一个值得关注的方向便是单智能体工作流与多智能体工作流的差异,或是灵活型系统与受控型系统在使用上的区别。

2025-11-19 10:59:43 580

原创 告别“一问就废”!让你的智能体拥有“举一反三”的超能力,这才是真正的泛化!

最近几天在测试和优化问答系统,看过之前文章的读者应该都知道最近的RAG系统从被动式RAG改造为主动式RAG,也就是智能体系统。但是在最近几天的测试中又发现了一些问题,因此需要对智能体进行一些优化;而最主要的问题就是智能体的泛化问题和拟合问题。

2025-11-19 10:57:13 557

原创 Agent落地的“最大陷阱”!Skills取代MCP?别让这个误解,毁掉你的整个AI布局!

尤其遇到有大量中间工具的情况,这个情况会更明显:比如,把一个会议记录下载然后转存到另一个软件中,那么整个会议记录会被计算两次,token消耗会直接爆炸。为了解决这个问题,Anthropic 推出了个新工具—— Claude Skills 。简单来说, Claude Skills 是一个Markdown 文件,里面有预先编写好的脚本、指令文档、资源,作用是告诉模型什么情况下调用,以及怎么执行某项任务。

2025-11-19 10:56:00 551

原创 大模型“工具箱“乱成一锅粥?T2A检索技术让效率飙升28%,小白也能秒变AI架构师!

本文提出Tool-to-Agent Retrieval(T2A)技术,通过将工具和Agent统一嵌入同一向量空间,解决多Agent系统中工具选择难题。实验表明,该方法在8种编码器测试下平均提升13%-28%的检索效率,即使轻量模型也效果显著。T2A构建工具-Agent二分图映射,实现一步完成工具或Agent选择,有效解决传统方法中token过多、工具被埋没、任务被拆分等问题,为构建可扩展的大模型多Agent系统提供新思路。

2025-11-18 10:13:26 503

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除