- 博客(1131)
- 收藏
- 关注
原创 揭秘AI内部机制:AI理解的重大突破
通过这个替代模型,亦步亦趋的捕获针对每一个提示语的归因图(attribution graph)归因图用于描述模型在特定输入提示下生成目标词元输出时所经历的推理步骤。归因图的边表征节点间的线性影响关系,节点代表以下对象:激活的特征输入提示中的词元嵌入重构误差输出逻辑值每个特征的活动强度由其输入边的权重之和决定。归因图展示了特征如何在特定输入提示下相互作用以生成模型输出。而特征在所有上下文环境中交互的全局图景更值得关注,相邻层神经元间的直接影响就是它们之间的连接权重;
2025-04-04 10:45:00
682
原创 基于大模型DeepSeek的企业典型AI应用
措施通过优化架构与针对性硬件配置,大幅降低训练成本。数据示例DeepSeek v3仅需558万美元耗时2个月完成训练,资源消耗显著低于行业巨头。企业受益无需巨额资金即可开展AI业务,极大降低智能化门槛。
2025-04-03 20:16:41
579
原创 神经网络求解偏微分方程:基本原理
综上所述,神经网络解偏微分方程的本质,并不是什么神秘莫测的方法,而是利用神经网络的强大逼近能力,将PDE求解转化为一个优化问题。无论是传统的多项式、傅里叶级数,还是现代的神经网络,本质上都是在寻找一类可参数化的函数族去逼近PDE的解函数。不同之处在于所选的基函数空间以及满足PDE的方式。通过适当设计损失函数和优化算法,PINNs不仅能够有效地解决各种类型的PDE,而且在高维空间和复杂边界条件下展现出独特的优势。
2025-04-01 19:11:25
798
原创 SCI一区论文学习 | 一种用于刀具剩余寿命预测的指数模型
基于切削刀具状态预测的主动维护策略可以减少昂贵的、计划外的维护事件。本研究提出了一种新的指数模型来预测刀具的剩余使用寿命(Remaining Useful Life, RUL)。
2025-04-01 19:10:02
663
原创 (Radiology, IF=12.1)如何利用生成式 AI 提高放射科医生的效率和准确性
但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
2025-03-31 16:13:18
429
原创 深入MCP Remote模式:两大基础协议及工作原理,一步步教你弄懂
是一种基于HTTP协议的单向通信技术,允许服务器主动实时向客户端推送消息,客户端只需建立一次连接即可持续接收消息。
2025-03-31 16:09:10
805
原创 企业DeepSeek落地路径、架构及方案建议
但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
2025-03-30 10:45:00
1693
原创 大模型时代的内容分析Agent解决方案与业务实践
在当今的电商环境中,内容化已经成为淘宝的一大战略。无论是在站内通过图文和视频形式,作为商品的展示载体,促进用户的消费转化;还是在站外投放的广告内容,吸引用户进入淘宝,实现用户增长,内容的力量都不可忽视。然而,许多内容创作者——包括KOL、商家、甚至是专业的广告设计师,亦或是AIGC内容生产方,在创作过程中,常常不确定什么样的内容能更有效地吸引用户,或者成为爆款。他们可能偶尔能创作出爆款内容,但却不清楚为什么会爆,也不明确哪些内容要素能提升内容质量,更好地吸引用户。
2025-03-29 10:47:52
1000
原创 大语言模型后训练技术全面综述:推理增强、监督微调、强化学习、测试时缩放、模型对齐
大语言模型(LLMs)彻底改变了自然语言处理领域,并催生了各种各样的应用。在海量网络规模数据上进行的预训练为这些模型奠定了基础,然而目前研究界越来越关注微调技术,以期取得进一步的突破。虽然预训练提供了广泛的语言基础,但微调方法使大语言模型能够完善知识、提高推理能力、增强事实准确性,并更有效地与用户意图和道德考量保持一致。微调、强化学习和测试时缩放(Scaling)已成为优化大语言模型性能、确保鲁棒性和提高在各种实际任务中适应性的关键策略。
2025-03-29 10:43:55
695
原创 通往 AGI 之路前传:究竟该怎么理解 Agent?
关于大模型,玄妙之事很多。比如大家都认为 2025 年是 Agent 爆发年,但是要问 Agent 是什么,怎么定义 Agent 时,一千个人眼中能有一千个 Agent 的概念。Manus 让 Agent 具象化了一些,而 OpenAI 在发布 Agent 开发工具时,给出了两个定义:Agent 是能够独立为用户完成任务的系统[1];配备了指令和工具的大语言模型[2]。怎么感觉就算 OpenAI 自己的团队都没有把 Agent 的定义统一清楚呢?!
2025-03-28 10:57:10
679
原创 Agent框架标准化趋势及OpenManus-RL增强Agent规划能力训练框架
先说一个,word解析,应该老老实实解析底层xml,转pdf再解析(有很多现成的工具库了),绕了大圈,效果还不保证,例如表格,除非里面是贴的图片这个时候则单独做解析即可。另外,我们继续来看看Agent的一些事,两方面,。关于agent,OpenAI 放出来新的agent 开发套件,https://openai.com/index/new-tools-for-building-agents/,其实就是 Responses API,简化智能体开发的核心工具。
2025-03-28 10:56:11
807
原创 突破性研究:Med-R1医疗大模型如何通过强化学习实现跨模态医学推理的普适性突破
为评估Med-R1的跨模态泛化能力,研究团队在八种不同的医学影像模态上测量了其准确性(表1)。Med-R1实现了69.91%的强大总体准确率,表明其能够在不同医学影像模态之间进行泛化。值得注意的是,在CT、MRI和X射线上训练的模型表现出最高的泛化能力,总体得分分别为71.44%、71.26%和72.35%。
2025-03-28 10:55:07
735
原创 Dify+RAGFlow打造企业级智能知识库:PDF表格秒变结构化数据,检索精准度暴增
该架构通过API接口实现Dify与RAGFlow的解耦部署,既保证文档处理的专业性,又保持应用开发的灵活性。关键配置部署命令该配置实现本地模型调用,避免云端API延迟。特别注意该配置融合语义检索与关键词匹配,经测试可使表格类数据召回率提升:RAGFlow通过CV算法识别PDF中的表格位置,避免传统OCR的错位问题(测试显示扫描件表格解析完整度提升62%):使用BGE模型对Top50结果重排,消除"语义漂移"现象。
2025-03-27 10:57:04
912
原创 AI赋能,普通员工向“超级个体”进化的路径
在信息和技术爆炸的时代,普通员工和个人面临着海量信息超载的压力,如何快速有效的获取、理解和应用信息成为提升个人效能的关键瓶颈。AI技术的快速发展,以及它所展现出的巨大潜能为赋能组织员工和个人提供了前所未有的机会。AI技术发展至今,它已不再仅仅是替代重复性劳动的工具,更是组织和个人能力的放大器和创新加速器,可以帮助我们突破自身能力边界、实现质的飞跃。
2025-03-27 10:55:45
342
原创 DeepSeek大模型原创核心技术解读
自GPT采用Transformer架构取得成功以来,经典Transformer架构一直是很多大模型的标配。但这不意味着Transformer是完美无缺的。即MLA。MLA用于高效推理,源自DeepSeek V2的原创,其显著降低了推理显存的消耗。MLA主要通过改造注意力算子压缩KV 缓存大小,将每个查询KV量减少93.3%,实现了在同样容量下存储更多KV缓存,极大提升了推理效率。
2025-03-27 10:54:35
967
原创 从“无法找到答案”到“一问一个准”! Contextual Embedding让chunk自带上下文,精准召回,效果立竿见影!
在传统的RAG中,文档通常被分成更小的块以进行有效的检索。虽然这种方法对于许多应用程序都很有效,但当单个块缺乏足够的上下文时,它可能会导致问题。Contextual Embedding 通过使用LLM给每段chunk补充上下文信息,用户更精准召回和更高质量的回答。当我们提问:“What was the revenue growth for ACME Corp in Q2 2023?”,虽然这段chunk是真实答案,但是却检索不到。
2025-03-26 10:06:29
818
原创 AI提示词设计:一篇文章带你从入门到精通,轻松掌握高效提示词技巧!
Prompt工程是掌握编写高效的艺术,通过创造性设计和优化Prompt,以便从语言模型中获得最佳的输出结果。公式概括:Prompt × AI 理解 = 输出质量Prompt越狱是指通过特殊的提示词绕过模型内置的安全限制,让AI模型执行通常会被限制的行为。这种技术本质上利用AI模型对文本理解的漏洞,用户可能需要设置高的利用生态系统,在AI场景,越狱作用在于打破模型限制,突破系统设计之外的能力。下面介绍几个经典的提示词。2??3???0.11.2.
2025-03-26 10:05:23
845
原创 DeepSeek医疗多场景应用分析:基于420余家医院的实证研究
一、患者服务类代表医院:东南大学附属中大医院(DeepSeek-R1:671B)典型案例:顺德第五人民医院(DeepSeek-R1)支持院内导航,支持“肚子像被孙悟空打翻炼丹炉”等生动描述识别代表医院:武汉市中心医院(DeepSeek-R1:671B)代表医院:甘肃省妇幼保健院(DeepSeek-R1:671B)特色案例:广东省妇幼保健院(DeepSeek-R1)构建全生命周期健康管理体系区域覆盖:丰泽区泉秀街道社区卫生服务中心(DeepSeek-R1:671B+腾讯混元)二、临床支持类。
2025-03-26 10:03:16
990
原创 从零构建企业级财务分析数仓 | Hive建模实战
但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
2025-03-25 09:57:33
921
原创 DeepSeek QwQ32B 如何提升RAG知识库问答准确率
{"字段":"值"}•:在语义关联场景(如技术概念解释)表现突出,测试显示首条命中率达83%。•:精确匹配场景(如法规条文编号)采用全文检索模式,准确率比纯向量高29%。•:通过DS分类模型自动判断问题类型(语义/精确匹配),动态切换检索模式。•:对长文档采用头部80%内容权重系数1.2,尾部20%系数0.8,缓解信息稀释问题。• 热点查询(如高频政策条款)预计算DS向量并存入Redis,命中时直接调用(延迟从120ms→15ms)。• QWQ采用。
2025-03-25 09:55:02
772
原创 YOLOe问世:三行代码实时“看见一切“,目标检测进入全提示时代
从2015年YOLOv1首次实现实时检测,到2024年YOLOv10优化效率,YOLO系列始终是目标检测领域的标杆。但传统YOLO如同戴着"类别镣铐"的观察者——只能识别预先定义的物体。当面对未知类别或复杂交互场景时,这种局限性暴露无遗。通过三大模式,让AI像人类一样自由理解世界。就像给机器装上"多模态眼睛",既能听懂语言指令,又能看懂手势示意,甚至自主发现新事物。在这里插入图片描述。
2025-03-24 11:28:33
341
原创 阿里通义RAG团队等提出RAG与长文本对比新框架,助力智能路由决策机制设计
论文标题:LaRA: Benchmarking Retrieval-Augmented Generation and Long-Context LLMs - No Silver Bullet for LC or RAG Routing开源地址: https://github.com/Alibaba-NLP/LaRA随着大型语言模型(LLMs)的快速发展,输入长度限制从最初的4K token到如今普遍支持的128K甚至百万级token输入,“长文本”(Long Context, LC)的定义也在发生着巨变。
2025-03-24 11:20:59
938
原创 全面解读DeepSeek蒸馏技术:模型蒸馏和数据蒸馏
蒸馏技术(Knowledge Distillation, KD),该概念最早出现在2015年由Geoffrey Hinton、Oriol Vinyals 和 Jeff Dean发表的一篇名为《Distilling the Knowledge in a Neural Network》的论文中,如下图:简单地说,它就是一种模型压缩和优化的方法,其核心思想就是“通过将一个大型且复杂的模型(称为“教师模型”)的知识、传递给一个小而高效的模型(称为“学生模型”)
2025-03-24 11:18:14
1190
原创 [论文分享] 使用大型语言模型的多目标启发式演化
基于大模型(Large Language Model, LLM)的自动算法设计是当前的研究热点之一。在 [1, 2] 中,我们将算法设计问题形式化为算法空间中的优化问题,并提出了一个基于大型语言模型的迭代搜索框架,以实现高性能算法的自动化设计。具体来说,该框架将每个算法视为搜索空间中的候选解,并利用LLM进行解的交叉和变异操作,从而生成新的解。基于这一思路,我们开发了一个具体框架 Evolution of Heuristics (
2025-03-23 10:45:00
954
原创 人形机器人大脑:具身智能--行业全解析(附核心标的)
具身智能,英文Embodied AI,简称EAI, 依靠物理实体(如机器人、自动驾驶车辆等)与环境交互来实现智能增长的智能系统。在智能体与环境的交互过程中,通过感知、控制和自主学习来积累知识和技能,形成智能并影响物理世界的能力。其核心在于将感知、决策和执行紧密结合,主要挑战在于硬件性能、算法泛化能力与系统集成水平。
2025-03-22 10:31:44
1179
原创 这篇Long CoT Reasoning综述隐藏好多idea啊!
近年来,以OpenAI O1和DeepSeek R1为代表的推理型大语言模型(RLLMs)在数学、编程等复杂任务中展现出强大能力,其核心在于**长思维链(Long CoT)**的应用。传统短思维链(Short CoT)因推理深度不足、路径单一,难以解决需要多步逻辑推导的问题。本文首次系统化梳理Long CoT的特征,填补了该领域的综述空白,并为解决“过思”和“测试时扩展”等争议提供统一视角。Long CoT的演进脉络两者的三维特性差异,如深度、探索、反思的整合不同推理格式在GSM8K等基准上的性能对比。
2025-03-22 10:29:32
767
原创 AI智能体的概念和应用场景
AI Agent(AI 智能体)是指一种能够感知环境,自主决策并采取信工以实现特定目标的智能实体,它结合了人工智能技术(如机器学习,自然语言处理等),具备与环境交互,学习和适应的能力。
2025-03-21 10:48:12
473
原创 一文搞懂多模态理解(图像描述 + 视频描述 + 视觉问答)
图像描述任务要求模型能够准确识别图像中的物体、场景以及它们之间的关系,并用自然语言生成一段简洁、流畅且富有信息量的描述****。**
2025-03-21 10:46:57
762
原创 大模型量化技术(Quantization)可视化指南
顾名思义,大型语言模型的规模通常过于庞大,难以在消费级硬件上运行。这类模型的参数量可达数十亿级别,通常需要配备大容量显存的GPU来加速推理过程。为此,越来越多的研究聚焦于通过优化训练方式、引入适配器等技术缩小模型规模。其中一项关键技术便是。本文将以语言建模为背景,系统介绍量化技术领域,通过逐层剖析核心概念助您建立直观认知。我们将深入解析量化的各类方法、实际应用场景及其底层原理。作为可视化指南,文中将包含大量图表辅助建立量化技术的直观理解!
2025-03-21 10:45:06
754
原创 用于化学数据提取的大型语言模型
化学和材料科学领域积累了大量的知识,但这些知识大多以非结构化的自然语言形式存在,而结构化数据对于创新和系统化的材料设计至关重要。传统上,数据提取依赖于人工整理和部分自动化方法,但这些方法在多样化的化学和材料研究中面临挑战。随着LLMs的出现,这一领域发生了重大变化,LLMs能够解决未明确训练的任务,为数据提取提供了一个强大且可扩展的替代方案。然而,将LLMs应用于化学和材料科学数据提取时,也面临着独特的挑战,但化学专业知识和物理定律也为验证LLMs输出提供了机会。
2025-03-20 10:25:49
994
原创 人工智能在病理组学领域的最新研究进展|顶刊速递
Multimodal histopathologic models stratify hormone receptor - positive early breast cancer”发表于,通过开发多模态深度学习工具Orpheus,
2025-03-20 10:24:29
802
原创 从裁员到年薪百万:程序员靠RAG技术逆袭的“核心密码”
作为一名从业七年的程序员,最近听到很多程序员朋友都喜提了n+1裁员大礼包。上周与老友聚会时,大家纷纷诉说着各自最近的遭遇,聚会气氛一度十分沉重。老Z感叹:“公司决定将部分业务外包,结果我被列入了裁员名单。”老L则无奈道:“市场竞争激烈,项目减少,团队预算被削减,前几天我也被裁掉了。”聚会回家后我十分焦虑地打开了招聘软件,发现传统程序员的岗位出现了僧多肉少的情况,hr每天回复几十次的都有,关键薪资待遇并不是很理想。
2025-03-20 10:23:02
596
原创 通义QwQ-32B+Milvus,消费级显卡布满血大模型与RAG的时代来了!
最近,通义开源的QwQ-32B模型可谓是火的一塌糊涂。作为一个中型推理模型,QwQ-32B。
2025-03-19 20:39:58
1082
原创 重磅!哈佛推出首个用于治疗推理的AI智能体,可自行调用211个工具
这篇论文介绍了一个名为TXAGENT的AI代理,用于通过多步推理和工具使用实现治疗推理。研究背景背景介绍:这篇文章的研究背景是精准治疗需要多模态自适应模型来生成个性化的治疗方案。现有的大型语言模型(LLMs)虽然能够处理治疗任务,但缺乏实时访问更新的生物医学知识的能力,并且常常出现幻觉和不可靠的推理。研究内容:该问题的研究内容包括开发一个AI代理TXAGENT,通过多步推理和实时生物医学知识检索来分析药物相互作用、禁忌症和患者特定的治疗策略。
2025-03-19 20:34:47
687
原创 荣登Nature招牌1区Top!可解释的多模态融合模型迎来新突破!
现有关于多模态融合的研究多集中在模型性能的提升上,对可解释的探索比较少。但实际上,可解释性是提升用户信任、优化模型决策的关键,具有重要的研究价值,符合当前学术界对透明AI的迫切需求。因此,想要在多模态领域拥有成果,是个很好的选择。中山六院团队的可解释多模态融合模型Brim,以及Nature子刊上的可解释纵向多模态融合模型,都是近期非常值得参考的研究,推荐感兴趣的论文er研读。
2025-03-19 20:32:52
809
原创 110页PPT | 华为战略解码:从战略规划到落地执行的管理系统
华为从战略规划到落地执行的管理系统是一个闭环流程,涵盖战略制定、解码、执行与监控等环节。通过洞察市场、明确战略意图,利用BLM模型等工具进行战略规划,再将战略分解为组织和个人的可执行任务,确保各层级目标一致。执行过程中,建立支撑战略的正式组织,强化人才布局与组织能力,营造良好的组织氛围,同时运用全面预算管理、绩效监控等手段,实时跟踪战略执行进度,定期复盘并优化调整,形成从战略到执行的完整闭环,保障战略有效落地。
2025-03-18 14:01:46
964
原创 谷歌 Gemini Embedding:文本嵌入领域的新王者
在人工智能这个超热闹的 “江湖” 里,技术突破就像时不时放的超级大烟花,总能把大伙惊得合不拢嘴。最近,谷歌带着它的 Gemini Embedding 闪亮登场,这 “家伙” 一出现,可算是在业界掀起了一场超级旋风。啥是文本嵌入技术呢?简单来说,文本嵌入技术就是将文字转化为数字向量,让 AI 能够理解文本含义及上下文关系的关键技术。打个比方,就像是给文字穿上了一件数字 “外衣”,把它们变成 AI 能轻松看懂的数字向量,这样 AI 就能搞清楚文字到底啥意思,前后文有啥关系啦。
2025-03-18 13:47:00
946
原创 GraphRAG最新成果:基于图的RAG统一框架深度分析 — 港中深&华为
基于图的检索增强生成(RAG)已被证明在将外部知识整合到大型语言模型(LLMs)中非常有效,提高了它们的事实准确性、适应性、可解释性和可信度。文献中提出了一些基于图的RAG方法。然而,这些方法尚未在同一实验设置下得到系统和全面的比较。本文首先从高层次的角度总结了一个统一的框架,以整合所有基于图的RAG方法。然后,我们广泛比较了一系列问答(QA)数据集上有代表性的基于图的RAG方法——从具体问题到抽象问题——并检验了所有方法的有效性,提供了对基于图的RAG方法的彻底分析。
2025-03-18 13:45:45
859
原创 OpenManus+QwQ32B 本地部署
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。天道酬勤,你越努力,就会成为越优秀的自己。
2025-03-17 20:31:03
846
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人