- 博客(879)
- 收藏
- 关注
原创 全球首个7B全模态模型!阿里Qwen2.5-Omni登顶榜首,实时语音+视频交互开源免费
在人工智能领域,单一模态模型已取得显著成果,但人类智能是多模态的。我们通过视觉、听觉等感官感知世界,并通过语言等方式交流。因此,开发能处理多种模态输入并输出的模型,对实现更接近人类智能的系统至关重要。Qwen2.5-Omni 正是在此背景下诞生,旨在打破模态壁垒,实现更自然、高效的人机交互。本文将详细介绍其技术原理、功能特点、应用场景及快速使用方法。
2025-04-01 19:20:23
1048
原创 南大LAMDA | PILOT: 基于预训练模型的持续学习工具包
研究意义深度学习在很多领域取得了巨大的进展,但是在日益变化的世界中,我们的训练样本常常以流式数据的形式产生。例如,尽管ChatGPT展现出了卓越的推理和对话能力,但它在实时为用户提供最新信息方面仍然面临一定的挑战,这种局限性主要来源于在新数据上重新训练GPT模型需要消耗巨大资源。为了解决该问题,持续更新和优化模型显得尤为关键,持续学习旨在使模型能够适应并从流式数据中不断学习和更新。同时,解决“灾难性遗忘”问题(即模型学习新的知识之后,几乎遗忘掉之前训练的内容),是持续学习领域的最关键的挑战之一。
2025-04-01 19:18:50
711
原创 大数据和先进人工智能方法及电力系统应用
但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
2025-03-31 17:07:14
223
原创 华为诺亚综述:生成式模型如何用于决策?
生成式 AI 正在重塑智能决策的未来!本综述系统性地归纳了七种生成模型,构建了一个全新的决策智能分类框架,涵盖控制器、建模器、优化器三大核心角色。我们深入剖析了生成模型在机器人控制、自动驾驶、游戏 AI、优化任务等关键领域的变革性应用,并前瞻性地探讨了未来研究方向。从智能体的自主学习到复杂决策的优化,生成式 AI 正成为人工智能发展的新引擎!随着技术的加速演进,我们正站在智能决策新时代的起点,迎接一个更加高效、自适应、泛化能力更强的 AI 时代。未来已来,你准备好了吗?
2025-03-31 17:06:04
700
原创 IEEE TII | 论文荐读!MSTCN+BiLSTM :多尺度时间卷积网络,用于钻柱振动的自动化诊断
钻井过程由钻机控制,如图 1(a) 所示。钻机主要由两大系统组成:钻柱旋转系统和泥浆循环系统。其中,钻柱系统从地面延伸至井底,包括吊钩、绞车、顶驱、钻杆、钻铤和钻头。绞车控制钻杆的垂直速度,而顶驱负责高速旋转。泥浆循环系统则通过泥浆泵输送钻井泥浆,以清理井底岩屑。图1 地质钻井过程和钻柱振动。(a) 钻井机。(b) 在轻微振动和剧烈振动下的钻压。© 在轻微振动和剧烈振动下的转速。(d) 在轻微振动和剧烈振动下的扭矩。在常规钻井作业中,利用地表多传感器钻井数据来管理钻井过程和监测钻柱振动。
2025-03-30 10:45:00
822
原创 用好DeepSeek就是:借力、借智、借时间
花了半天时间写稿子,却因为缺乏新意被读者无视?熬夜整理数据做分析,结果领导只瞥了一眼,说你不懂市场?明明很努力,却总赶不上别人的节奏,陷入“时间内卷”?我是持续探索AI协作方式,觉醒强大自己的周知。今天聊聊这“三借”.你有没有好奇过,为什么有些人能一个人干出一个团队的活儿?其实,秘密就在于他们懂得"借力"。想象一下这个场景:你以前需要花5000块请专业人士做份商业计划书,可能还要等上一周。现在,只需要花30分钟和DeepSeek对话,就能得到一份相当专业的方案。这就是古人说的"善假于物",现代版的。
2025-03-29 11:03:59
621
原创 你的VLM竟是潜在的世界模型?颠覆传统!WMNav突破室内导航瓶颈
传统的Object Goal Navigation任务要求智能体探索未知的室内环境,并导航至给定类别(例如床、沙发、马桶)中的任意实例。智能体从指定的初始位置开始。在每个时刻,智能体获取周围环境的RGB-D观测值及其实时姿态。然后,智能体选择动作以寻找目标。如果智能体在距离目标的预定义距离阈值内停止,则任务视为成功。
2025-03-29 11:02:47
793
原创 7B模型搞定AI视频通话,阿里最新开源炸场,看听说写全模态打通,开发者企业免费商用
深夜重磅!阿里发布并开源首个端到端全模态大模型——,来了。仅靠一个,就能搞定文本、音频、图像、视频全模态,并实时生成文本和自然语音。堪称7B模型的全能冠军。你的iPhone搭载的很可能就是它!现在打开Qwen Chat,就能直接和它实时进行视频或语音交互:话不多说,先来看一波能力展示。在大街上同它视频通话,它能正确识别周围环境,按照你的需求为你推荐餐馆:,时长00:55走进厨房,它又化身“智能菜谱”,一步步指导你变成大厨:,时长01:16。
2025-03-28 11:49:59
897
原创 搭建属于自己的AI大模型,DeepSeek-R1-70B本地化部署指南
至此,你已经成功完成了DeepSeek-R1-L70-Preview在本地环境中的部署。性能调优调整批处理大小(batch_size)以提高吞吐量。通过分布式部署(如多机多卡训练)提升服务能力。安全配置配置HTTPS访问,确保数据传输安全。设置权限控制,防止未授权的调用。监控与维护部署监控工具(如Prometheus、Grafana)实时监控服务状态和资源使用情况。定期备份模型文件和配置信息,确保数据安全。
2025-03-28 11:08:21
973
原创 AI 智能体应用,是企业专属的“私房菜”,而非千篇一律的“预制菜”
AI 智能体应用为企业量身打造的,是专属的“私房菜”,而非千篇一律的“预制菜”。企业家们,不要问我 AI 能做什么,而应告诉我你们想要做什么,你们的业务痛点究竟在哪里。我来帮你分析解决方案。
2025-03-27 11:11:09
381
原创 COMPAG新文:基于多模态人工智能与大语言模型的马铃薯病害检测与防治
马铃薯病害检测的多模态人工智能模型·开发了一个大型语言模型在线平台(PotatoGPT)·将多模态人工智能模型推广到其他茄科病害马铃薯易受早疫病和晚疫病的侵害,严重影响其产量和质量。本研究提出了一种多模态人工智能模型,用于检测马铃薯的早疫病和晚疫病,表现出卓越的检测性能。首先,从视觉分支角度提出了MSC-ResViT检测模型,在测试集上取得了92.15%的准确率,优于其他深度学习网络。
2025-03-27 11:09:58
366
原创 DeepSeek R1之后的推理大模型后训练增强技术解析
我的猜测是,研究人员受到了 DeepSeek-R1 论文中“顿悟时刻 (Aha moment)”图的启发,研究人员在图中看到 LLM 提出了类似“等等,等等。等等。这是一个顿悟时刻,我可以标记一下 (Wait, wait. Wait. That’s an aha moment I can flag here.)”的内容,这表明纯强化学习可以诱导 LLM 产生推理行为。有趣的是,他们还尝试了其他 token,例如“嗯 (Hmm)”,但发现“等待 (Wait)”的表现略好。
2025-03-27 11:09:17
824
原创 通过知识图谱可视化增强 LLM 开发与调试
本文翻译自 yworks 文章,主要讲述如何通过有效的知识图谱可视化增强 LLM 开发。学习如何利用 yFiles 创建直观、交互式的图表,从而简化 AI 应用的调试和优化。为了向 LLM 提供必要的上下文信息,AI 应用通常集成采用图检索增强生成(Graph Retrieval-Augmented Generation,RAG)方法。然而,管理和交互知识图谱对开发者来说是一个重大挑战。这些图谱涉及复杂的关系和结构,如果缺乏清晰的可视化工具,调试和优化将变得极其困难。
2025-03-26 10:18:19
869
原创 ## 如何学习大模型 AI ? 由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。 但是具体到个人,只能说是: **“最先掌握AI的人,将会比较晚掌握AI的
在详细分析基于大型语言模型(LLM)的智能体时,它们可以被分为两大主要类别:单智能体系统和多智能体系统。这两种不同的系统类型在应用领域、记忆与反思机制、数据需求、模态以及工具集等方面表现出显著差异。本文接下来将深入探讨这些智能体类型,以帮助读者理解它们的独特属性和应用范围。
2025-03-26 10:17:17
746
原创 YOLOE:实时“看见一切”的高效目标检测与分割模型
目标检测和分割是计算机视觉的核心任务,广泛应用于自动驾驶、医学分析和机器人等领域。传统的 YOLO(You Only Look Once)系列模型虽然高效精准,但受限于预定义类别,难以适应开放场景的需求。近年来,开放集目标检测借助文本提示(text prompts)、视觉提示(visual prompts)或无提示(prompt-free)方法提升泛化能力,但通常面临计算开销大、部署复杂等问题。
2025-03-26 10:15:49
1046
原创 9个最佳prompt框架:解锁LLMs无限潜力
CLEAR框架特别适用于当你需要详细且结构化的研究查询,不容许任何模糊性时。CLEAR分别代表:Context(背景)、Logic(逻辑)、Expectations(期望)、Action(行动)和Restrictions(限制)。背景(Context)提供背景信息,解释你为什么需要这些信息。这有助于AI理解你的研究动机和目的。逻辑(Logic)阐述你研究的推理过程和你试图达到的目标。这确保了AI能够遵循你的思路来回答问题。期望(Expectations)
2025-03-25 10:08:52
628
原创 MSGNet:多尺度融合相关性学习的时间序列预测模型
时间序列预测在科学、政策制定、精算和销售等多个领域具有重要价值。其核心在于识别数据中的隐藏模式,无论是未来的还是隐藏的,这些模式通常可以从过去的观察中揭示出来。时间序列预测涉及对随时间收集的数据点进行分析和预测,为股票价格、天气状况或客户行为等变量提供洞察。在时间序列预测领域,存在两个相互关联的领域:序列内相关建模和序列间相关建模。序列内相关建模基于特定时间序列内的模式预测未来值,而序列间相关建模则探讨多个时间序列之间的关系和依赖性。近年来,深度学习模型在时间序列预测中取得了突破性进展。
2025-03-25 10:08:09
914
原创 专题解读 | RAG模型的安全挑战:针对RAG的攻击算法
PoisonedRAG和TrojanRAG攻击为RAG模型的安全性带来了严峻挑战。这两种攻击方法不仅能够在特定输入下引导模型产生恶意输出,还可能对模型的泛化能力和用户信任度造成严重影响。因此,我们必须高度重视RAG模型的安全性问题,并积极探索有效的防御措施随着LLMs和RAG模型的不断发展,我们需要持续关注这一领域的安全动态,加强模型的安全设计和检测机制,以确保这些模型在各个领域的安全应用。同时,研究人员和开发者也应加强合作,共同应对RAG模型面临的安全挑战,推动人工智能技术的健康发展。
2025-03-25 10:06:43
703
原创 DeepSeeks本地化知识库就这么干!3步搞定!
▍通过以上测试,DeepSeek已经可以结合我们刚才投喂的新知识较好的回答【快乐IT】是谁的问题注:如果还没生效,可以刷新一下页面看看▍然后,我继续问:快乐IT他提供什么服务,请问一下他帮我写一段基于.net遍历目录下所有文件并重新命名的代码。
2025-03-24 11:42:52
803
原创 跑满血版DeepSeek配置预算再降90%!本地部署最强AI模型,创作效率飙升指南
2025年,苹果M3 Ultra芯片的Mac Studio以“性能怪兽”姿态杀入AI领域,顶配机型仅需10万元即可本地部署6710亿参数的DeepSeek-R1满血版,彻底改写个人AI生产力规则!本文从硬件配置、部署教程到避坑指南,带你解锁“平民超算”的终极玩法。
2025-03-24 11:41:46
1140
原创 自驱动实验室 | 看AI如何重构化学合成新范式
金属有机框架(MOFs)因独特可调结构,在能源存储、药物递送、环境修复等领域极具潜力。但它的合成复杂、结构多样,给传统研究带来巨大挑战。如今,人工智能(AI)与实验室自动化的融合,为 MOF 研究开辟了新路径。文章思维导图。
2025-03-24 11:40:48
1043
原创 数字经济三大引擎:数据、算法、算力
数字经济已经成为全球经济的重要组成部分。。它们好比三个齿轮,相互啮合、协同运转,推动数字经济不断向前发展…如果说数字经济是一辆高速运转的跑车,那么数据就是驱动这辆跑车的燃料。数据被形象地称为"21世纪的石油",它是数字经济时代最重要的生产要素之一。与石油相比,数据有着更为独特的属性:它是的,可以被多次多方使用而不损耗;具有,可以极低成本地被复制传播;还具有,不同维度、不同来源的数据价值差异巨大。这些特性使得数据在等方面呈现出截然不同于传统要素的特点。
2025-03-23 10:45:00
1478
原创 医疗+AI,一场颠覆式变革正在上演
当AI将三甲医院的诊断能力复制到县城卫生院,当电子病历从记录工具升级为预测引擎,当数据资产成为比药品更“暴利”的商品时——医疗投资正在经历从“
2025-03-22 10:47:37
973
原创 [论文分享] CEoH:利用大语言模型为新兴优化问题设计启发式算法
组合优化问题通常依赖启发式算法来生成高效解决方案。然而,手动设计启发式方法既耗费资源又受限于设计者的专业知识。近期人工智能的进展,特别是大语言模型(LLM)的发展,展示了通过进化框架自动生成启发式方法的潜力。现有研究主要关注旅行商问题和在线装箱问题等经典组合优化问题的构造性启发式方法设计。本研究探讨了LLM是否能为小众的、尚未广泛研究的优化问题有效生成启发式方法,并以单位负载预编组问题(UPMP)为例。作者提出了一种 EoH [1,2] 框架的扩展:基于大模型的上下文启发式演化框架(CEoH)。
2025-03-22 10:45:51
715
原创 一文图解Agent智能体:60张图、14个技术点回顾Agent的基本认知
要了解LLM agent是什么,首先来探索LLM的基本能力。传统上,LLM不过是一个接一个地进行下一个token预测。通过连续采样许多token,可以模拟对话,并使用LLM对问题给出更详细的答案。然而,当继续“对话”时,任何给定的LLM都会展示出它的一个主要缺点,它不记得对话。
2025-03-21 11:03:48
417
原创 目前来看,ollama量化过的DeepSeek模型应该就是最具性价比的选择
大模型中的每一个参数就是一个数字,默认的存储精度一般是BF16或者是FP16,学过编程的都知道,FP16就是16位半精度浮点数,数据长度有16bit,也就是2字节。按照这个容量计算,7B(70亿)的模型文件大小应该是14 GB左右,实际上也差不多,有15,237,852,832字节,合14.1 GB,而把这个模型运行起来,大概也是就是占用这么大的显存,实际上也差不多,要占用14623 MB,合14.28 GB。
2025-03-21 11:02:35
1219
原创 一文带你详细了解:大模型MoE架构(含DeepSeek MoE详解)
混合专家模型 (Mixed Expert Models,简称 MoEs) ,最早是随着 Mixtral 8x7B 的推出而逐渐引起人们的广泛关注。最近随着DeepSeek的爆火,MoE又进一步引起大家的关注。本文作者将带你了解 MoEs的发展史、核心组件、训练方法,推理中各因素考量和DeepSeek MoE详解。混合专家模型(MoE)的理念最早源自 1991 年的论文《Adaptive Mixture of Local Experts》。
2025-03-21 11:01:11
1213
原创 告别人工标注!大模型自产自销训练数据实现「自我迭代式进化」
研究探索小型大语言模型 (LLM) 如何通过生成、研究和回答自创的问答对,学习基于强化学习 (Reinforcement Learning) 的智能搜索 (Agentic Search),从而自主提升研究与推理能力。整个过程均可在单张 RTX 4090 上运行!本项目基于 Unsloth’s Efficient GRPO code(https://unsloth.ai/blog/r1-reasoning)构建,并新增了函数调用与智能循环的支持。🚀。
2025-03-20 10:47:18
1003
原创 39K 颠覆传统搜索!RAGFlow:AI驱动的开源文档搜索引擎来了!
RAGFlow是由 Infiniflow 团队在 GitHub 上开源的一款基于深度文档理解构建的开源 RAG 引擎。RAG(Retrieval-Augmented Generation,检索增强生成)旨在为各种规模的企业和个人提供高效、智能的文档搜索与问答体验。它通过将检索技术与生成式AI结合,能够从非结构化数据中提取关键信息,并生成准确、有据可依的回答。集成了完全自动化的 RAG 工作流,同时提供易用的 API,可以轻松集成到各类企业系统。
2025-03-20 10:46:22
748
原创 MISO 算法:破解多模态空间组学数据,解析组织复杂性|顶刊精析
本文聚焦多模态空间组学数据分析难题,提出MISO(MultI-modal Spatial Omics)算法,旨在解决组织复杂性研究中的关键问题。多模态空间组学整合多种组学数据,有助于理解细胞定位与组织功能关系,但现有分析方法存在诸多缺陷。
2025-03-20 10:43:14
839
原创 构建企业RAG系统的全面过程,遵循“Garbage in, garbage out” 原则
检索增强生成(Retrieval Augmented Generation),简称 RAG。结合向量检索(Retrieval)与内容生成(Generation)的AI框架。
2025-03-19 21:21:12
875
原创 Nature | 多伦多大学&Vector AI研究所联手,让Transformer读懂生命终极密码!
近几年,让人工智能的能力突飞猛进,不仅在领域大放异彩,也开始在领域展现出惊人的潜力。来自等多家顶级科研机构的研究团队,在期刊上发表了一篇重磅综述,。这项研究由计算机科学家、深度学习专家和生物信息学家联合完成,作者包括Micaela E. Consens、Cameron Dufault、Michael Wainberg、Fabian J. Theis等。团队将目光投向基因组数据,尝试用,去挖掘DNA序列中的隐含信息,帮助科学家。在过去的基因组分析中,研究人员大多使用。
2025-03-19 21:19:53
574
原创 研发数字化转型:驱动企业创新和发展的新引擎
随着市场环境的快速变化,产品生命周期的不断缩短以及消费者偏好的日益多元化和个性化,企业的产品、服务面临着更多的挑战。传统的研发模式已难以满足企业在创新、效率等多方面的需求。从内部来看,研发过程中的信息孤岛导致部门之间沟通协作效率低下,大量的重复工作浪费了宝贵的资源。从外部环境来说,客户对产品的个性化需求日益增长,传统研发难以快速响应这些复杂多变的需求。因此,研发数字化转型成为企业在激烈竞争中的生存和发展之道。那么想要成功推行研发数字化转型,必须要理解和解决2个关键问题:为什么企业要进行研发数字化转型?
2025-03-18 15:10:34
614
原创 DeepSeek医疗应用要重视提示词工程
提示词工程的核心是收窄输入问题域。DeepSeek大语言模型在医疗行业的应用,正在成为提升医疗科研质量的重要手段。其在辅助诊断、医疗咨询到个性化治疗方案等多个领域,都展现出巨大的潜力。然而,医疗行业对信息的准确性、专业性和安全性要求极高,如何确保DeepSeek的输出结果精准可靠,是当前亟待解决的问题。提示词工程作为优化大语言模型输出的关键手段,正逐渐成为医疗AI应用的重要组成部分。
2025-03-18 15:07:23
1002
原创 如何测量大模型是否过度思考?兼看最近GraphRAG及多模态RAG 进展
本文主要回顾了最近今天RAG的一些进展,包括GraphRAG,多模态RAG,这些都有一些往小了做的思路。另外,关于推理大模型的过度思考问题也是一个可解释的话题,但具体的结论,跟测试方式跟测试标注有关,这个是我们能够学到的点,如何建模一个评测任务。
2025-03-18 14:46:31
996
原创 哈佛医学院提出多模态人工智能算法,从临床前数据预测药物组合的临床结果
MADRIGAL 是一种多模态人工智能模型,可根据临床前数据预测药物组合的临床结果。联合疗法可以提高疗效并减少副作用,但确定安全有效的药物组合很困难。搜索空间巨大,药理相互作用复杂,并且许多化合物缺乏完整的临床前数据。大多数人工智能模型在关键药物数据缺失时会遇到困难。MADRIGAL 在训练和推理时都从不完整的数据集学习,使其即使对于数据稀疏的药物也能够预测临床结果。
2025-03-17 21:03:58
771
原创 让 DeepSeek 帮助我们快速选择数据分析图表类型
数据可视化是数据分析的重要方面,但是针对一个表格数据,使用何种可视化图表来展示数据信息,需要从多方面来考虑。例如,下面的各个地区销售统计表,如何绘制图表来展示这个表格数据的信息?将保存这个表格的工作簿上传到DeepSeek,选择“深度思考”模型,然后后输入提示词 “针对这个表格数据,可以使用哪些图表来分析?
2025-03-17 21:01:56
922
原创 DeepSeek点评心目中的社会仿真领域八大学术期刊
JASSS 是社会仿真领域的顶级期刊,专注于基于代理的建模、复杂系统和社会科学计算方法的交叉研究。
2025-03-17 21:00:43
1016
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人