- 博客(376)
- 收藏
- 关注
原创 万字长文,聊聊下一代AI Agent的新范式
聚焦Manus等类似的产品创新、Agent技术前沿、下一代Agent新范式,深度探讨以下问题:1.Manus实测真实效果如何,如何评价其产品设计?2.目前AI Agent展现能力的场景有哪些?3.AI Agent在技术上哪些重大进展?4.Manus等应用为AI Agent的发展带来哪些启示?5.如何看待Agent发展的“下半场”?6.未来AI Agent需强化哪些核心能力?(根据圆桌内容整理:DeepResearch与Manus的对比)(根据圆桌内容整理:下一代Agent特征)
2025-04-05 09:45:00
588
原创 Qwen2.5-Omni震撼发布!全球首个端到端全模态模型
本文将为大家介绍前沿模型Qwen2.5-Omni,代码已开源。Title:Code:Video:Skim:/导读/多模态模型Qwen2.5-Omni取得新突破该论文介绍了Qwen2.5-Omni端到端多模态模型,其创新性地整合了文本、图像、音频和视频的跨模态理解能力,并实现流式文本与自然语音的双向同步生成。关键技术突破包括:1)采用分块处理策略解耦长序列多模态数据,由多模态编码器负责感知、语言模型承担序列建模,通过共享注意力机制强化模态融合;
2025-04-04 10:45:00
419
原创 某警察学院采购DeepSeek大模型部署服务项目需求
一、硬件技术要求\1. 私有化部署专用计算存储设备- 型号:国产品牌- 处理器:12+核 20+线程,基础主频 2.0+GHz- 内存:DDR5 64GB +- 存储:1TB + SSD- 显卡:24GB + 显存- 网络:集成千兆网卡\2. 模型部署能力- 支持 DeepSeek R1-14B/32B 模型动态加载与热更新- 推理延迟≤500ms(批量处理≥100 请求 / 秒)\3. 其他要求- 提供三年原厂维保(7×24 小时响应,4 小时到场)
2025-04-04 08:00:00
438
原创 AI Agent 新探索:构建 AI 原生团队,使能 AI 员工
今天我们深入探讨了 AI Agent 的新范式:从被动工具到数字员工的转变。当我们回顾整个演讲,核心信息非常清晰—AI 不再只是我们使用的工具,而是即将成为我们的团队成员。想象一下,十年前我们如何看待智能手机。当时,它们被视为 “高级手机” — 一个通讯工具,只是增加了一些新功能。而今天,智能手机已经彻底改变了我们的生活和工作方式。AI 正经历类似的转变 — 从 “高级计算工具” 到 “数字同事” 的转变。构建 AI 原生团队需要从沟通文化和技术基础两方面入手。
2025-04-02 10:07:26
354
原创 基于图神经网络的高频交易系统
近年来,随着计算机硬件和人工智能技术的飞速发展,量化投资作为一大投资类别在中国市场迅速崛起。量化投资经历了从最初依赖人工投资理念的自动化处理,到如今基于数据、统计和人工智能构建全自动交易系统以实现稳定盈利的演变。高频交易 (HFT) 作为一种利用强大计算机程序在极短时间内执行大量订单的交易方法,正逐渐崭露头角。成熟的HFT系统能够以极低的风险实现盈利,类似于固定收益。然而,在特定市场中,HFT的整体容量相对有限。随着越来越多的公司和机构涌入这一领域,竞争日益激烈。要在竞争中脱颖而出,企业必须掌握领先的技术,
2025-04-02 10:06:06
290
原创 Trae 功能更新:内置 DeepSeek-V3-0324、支持OpenRouter模型接入、 WSL 连接及设备预览优化
Trae 目前内置了一系列表现出色的模型,同时支持自定义模型接入。而本次更新则新增了对 OpenRouter 的支持,接入 OpenRouter 后,用户可以更灵活地配置和使用自定义模型,通过 OpenRouter 实现模型与多种后端服务的交互,提升模型使用的扩展性和灵活性。用户可以在自定义模型接入界面便捷地完成 OpenRouter 的接入。
2025-04-01 10:16:00
273
原创 DeepSeek V3 0324更新,一文教你如何用AI编程提高工作效率,小白都可以直接上手
OK,今天关于DeepSeek V3 用法的分享就到这里啦,目前来说V3在前端展现出来的能力还是非常强大的,用来编写一些HTML网页绰绰有余。但缺点也很明显,一方面是多次沟通后,会出现卡死或者网页黑屏等问题无法解决;另一方面是后端能力不够强大,代码时常无法正常工作。不过相信在不久的将来DeepSeek发布了更强大的版本后这些问题一定会迎刃而解,让我们拭目以待。
2025-04-01 10:08:59
1568
原创 继续卷 又一个agent-智谱AutoGLM
今天智谱在2025中关村论坛上发布最新Agent 产品AutoGLM,具备深度研究能力和操作能力,可自主打开并浏览网页,完成从数据检索、分析到生成报告。我说一下使用体验,后台不要又来骂我推agent了。人家这是开源的。别bb了。超长任务:理解超长指令,执行超长任务。例如,在采购火锅食材的例子中,AutoGLM 自主执行了 54步无打断操作。并且,在这种多步、循环任务中,AutoGLM 的速度表现超过人手动操作。跨 app :AutoGLM 支持跨 App 来执行任务。
2025-03-31 22:09:02
705
原创 智谱悄咪咪发布的AutoGLM,直接颠覆我的想象。
他们发了一个AGI进程图,最好玩的还是用了《银河系漫游指南》里面那个终极答案42当了一个梗,而这个AGI进程图其实就是对标的人脑,而AutoGLM,就是AI,使用工具的能力。原始人类在70万年前,能走出非洲,依靠的,就是工具和火。而我,其实已经在3天前就拿到了AutoGLM的内测,在被封印了3天之后,也终于可以发出这篇文章。3天前第一次使用AutoGLM的那晚,它给我带来的震撼,给我带来的头皮发麻,到今天,我依然记忆犹新。现在,任何手机,你都可以把它,进化成贾维斯了。
2025-03-31 22:08:27
813
原创 17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤
AI社区掀起用大模型玩游戏之风!例如国外知名博主让DeepSeek和Chatgpt下国际象棋的视频在Youtube上就获得百万播放,ARC Prize组织最近也发布了一个贪吃蛇LLM评测基准SnakeBench。针对这一场景,来自。让大模型在8个游戏中互相PK,评测各主流大模型的推理能力。游戏PK避免模型“背答案”;除了输赢之外,GameBoT还评估大模型输出的中间步骤,实现更细粒度和客观的测评。
2025-03-29 11:46:48
943
原创 阿里深夜开源Qwen2.5-Omni,7B参数完成看、听、说、写
3 月 27 日凌晨,阿里通义千问团队发布 Qwen2.5-Omni。这是 Qwen 系列中全新的旗舰级多模态大模型,专为全面的多模式感知设计,可以无缝处理包括文本、图像、音频和视频的各种输入,同时支持流式的文本生成和自然语音合成输出。从此以后,你可以像打电话或进行视频通话一样与 Qwen 聊天!可以说是「语音聊天 + 视频聊天」都实现了。体验地址:https://chat.qwen.ai/
2025-03-29 11:31:34
553
原创 关于智能体(AI Agent),不得不看的一篇总结
智能体(Agent)是一种能够感知环境、制定决策并采取行动以实现特定目标的AI系统,一般具有记忆、规划、采取行为、使用工具等基本能力,如下图所示,其中规划中有思维链、能进行反思、目标分解。与传统AI系统不同,智能体具有自主性、持续性和适应性,能够在复杂环境中持续学习和优化自身行为。
2025-03-28 11:41:00
1370
原创 杀疯了!卷积LSTM时序预测 !!
基于卷积LSTM的时间序列多尺度建模方法,通过充分利用多尺度信息与时序依赖性,展现了在复杂数据预测中的巨大潜力。在以后的可以进一步探索注意力机制、多任务学习、模型压缩等方向,以适应更大规模、更高分辨率的数据应用场景。
2025-03-27 11:30:58
297
原创 论文浅尝 | KnowGPT:利用知识图谱增强大型语言模型的专业领域问答能力(NeurIPS2024)
本研究提出的KnowGPT框架,成功解决了LLM在专业领域内问答时可能遇到的知识不足的问题。通过巧妙地结合KG提供的结构化信息和支持,KnowGPT实现了更加精准的回答生成,为未来进一步探索LLM与外部知识源之间的协同作用奠定了坚实的基础。特别是,黑盒知识注入方法展示了其在编码知识入LLM方面的效率,并证明了这种方法在仅使用模型API的情况下也能对GPT-3.5进行有效改进。
2025-03-27 11:22:19
414
原创 大模型2025年3月报告分析2:智能体AI Agent
AI 智能体 Agent 的评测报告来了。【*智能体Agent深度分析介绍*】主要介绍各个模型在SuperCLUE通用榜单智能体Agent任务上的表现,包括对国内外模型的表现对比、九大任务场景的模型表现、推理模型与基础模型的的表现对比、当前模型在Agent能力上的不足。【智能体Agent任务介绍】主要考察在中文场景下基于可执行的环境,LLM作为代理,在单轮或多轮对话中调用工具完成任务的能力。【智能体Agent任务特点】1. 单轮、多轮对话:当前对话轮数覆盖1-6轮,解题步数覆盖2-14步。2. 任务覆盖场景
2025-03-25 15:49:48
1149
原创 Deepseek为什么选择蒸馏模型?一文彻底搞懂大模型蒸馏技术
我们看到,DeepSeek 提供了 7B、8B、14B、32B 等多个中小参数量模型,类似地,Qwen(1.5B、3B、7B、14B、32B)和 Llama(7B、13B、34B)也发布了多个中小参数量模型。然而,它们的生成方式有所不同:DeepSeek 是先训练一个超大参数模型,然后通过蒸馏的方式提供小参数量模型;而其他模型则是通过优化训练过程和模型架构来实现。那么,这两种方式有什么差异?DeepSeek 为什么选择蒸馏模型?本文将深入探讨以下几个问题:什么是大模型蒸馏?它诞生的背景是什么?
2025-03-18 10:48:14
389
原创 AI“落地”系列-RAG前置文档解析
RAG(Retrieval-Augmented Generation)时,对非结构化文档进行解析是至关重要的步骤,因为有多种优势。此图是整体的RAG流程,供参考,本文主要讲的是数据准备阶段。提高检索准确性结构化信息提取:非结构化文档解析可以将文档中的文本、表格、图像等信息提取并转换为结构化数据。这使得RAG系统能够更准确地定位和检索相关信息。例如,将PDF文档中的表格数据提取为结构化的表格格式,可以方便地进行查询和分析。
2025-03-18 10:45:40
394
原创 万字长文揭秘o1技术路线,强化学习增强LLM深度推理能力
过去两年中,人工智能领域见证了大语言模型前所未有的探索和进步。大语言模型已经逐步发展到能够处理越来越复杂的任务,如编程和解决高级数学问题。OpenAI o1 代表了 AI 的一个重要里程碑,它可以生成非常长的推理过程,并进行类似人类的推理动作,如澄清和分解问题、反思和纠正以前的错误、在遇到故障模式时探索新的解决方案。o1 模型显著超越了前代大语言模型的推理能力,达到了与博士水平相当的性能。其卓越的推理成就显著推动了 OpenAI 在其五阶段路线图中向通用人工智能第二阶段(“推理者”)的进展。
2025-03-17 21:23:16
709
原创 [论文解读]: 所有 DPO,SFT,RL 微调在数学上是等价的
所有 DPO,SFT,RL 微调在数学上是等价的论文首先证明了:在线学习,离线学习两种微调方法在数学上是等价了。它们理想的训练终点都是达到最大似然拟合。而现实中观察到的是:在线强化学习(两阶段训练 RM, RL), 明显好于离线学习(DPO,SFT,IPO)。然后,论文排除了其他可能性。例如:* 在线样本的内在价值* 离线微调的正则化不足* 在线微调的优化更容易* 全局奖励模型可以利用更多的数据* 奖励模型更容易泛化。
2025-03-17 21:19:42
821
原创 【博弈论基础与几大经典模型】古诺模型、斯塔克尔伯格模型Stackelberg Game、价格领导模型、Bertrand模型、Sweezy模型
博弈论(Gametheory)又称为对策论,是理性个体之间战略对策的数学模型的研究。通过建立思维模型分析战略游戏中个体的行为,并且研究它们的优化策略。这里的个体,不仅可以指代个人,也可以指代企业等各种需要做出决策的个体。以下笔记内容对应樊老师的视频课,小白都可以听懂的微观经济学理论,非常棒!
2025-03-14 10:30:32
1027
原创 什么是大模型?一图全面了解大模型,附国内外知名大模型及240余家大模型清单!
AI大模型是“大数据+大算力+强算法”结合的产物,是一种能够利用大数据和神经网络来模拟人类思维和创造力的人工智能算法。它利用海量的数据和深度学习技术来理解、生成和预测新内容,通常情况下有数百亿乃至数万亿个参数,可以在不同的领域和任务中表现出智能。
2025-03-14 10:26:42
852
原创 QWQ-32B vs DeepSeek-R1
QWQ-32B是一款高效且能力强大的推理模型,其性能接近DeepSeek-R1,同时规模更小、资源效率更高。它在逻辑推理、实时网络搜索和计算效率方面表现出色,非常适合需要高级问题解决和编程的任务。尽管缺乏图像处理能力,但其速度和适应性使其成为优先考虑效率和多功能性而非模型规模的用户的强大选择。
2025-03-13 10:34:09
964
原创 报告 | 比清华版更全面、更落地!《DeepSeek企业落地应用讲义精华全版258页》(附下载)
在当今数智化浪潮席卷全球的时代,人工智能(AI)已成为推动企业转型升级的关键力量。然而,对于众多企业来说,如何将AI技术真正落地应用,实现降本增效、创新发展,依然是一个亟待解决的难题。为此,大任智库AI应用创新团队研发了一本堪称AI应用领域的“宝典”——**与一些理论性强但缺乏实践指导的教材不同,大任智库版的讲义紧密结合企业实际痛点。比如在企业办公应用部分,详细阐述了AI如何助力企业员工提升工作效率、如何重新定义岗位价值,让企业切实感受到AI带来的巨大变革。
2025-03-13 10:30:51
1384
原创 使用DeepSeek+coze进行账号分析是真的香,小红书一键起号分析+批量下载视频
只用一个简单到离谱的工作流,就能让你轻松拿捏对标账号分析?是的,你没听错!这不是什么复杂操作,今天就带你走进 Coze 工作流的神奇世界,让你轻松掌握博主的所有视频和账号优缺点,以及参考建议!你只需要输入博主主页的地址,Coze 工作流就能自动获取博主所有的视频,并对博主账号的优缺点进行详细分析,还会给出参考建议。整个过程非常简单,只需要几分钟就能完成。Coze 工作流的分析结果非常全面,不仅能获取博主的所有视频,还能对博主的粉丝增长趋势、互动率、内容风格等进行深入分析。
2025-03-12 11:55:48
1221
原创 AI大模型全览:国内244个大AI模型及国外汇总
GPT系列、Gemini系列、Claude系列、LLaMA、Copilot**以及其他一些特色模型,目的是提供一个全面的指南,帮助用户了解和使用国外的人工智能大型模型(AI大模型),以便在学术研究、教学发展等领域中应用这些技术,提高效率和创新能力。**GPT 系列模型(OpenAI):**GPT 系列模型是由 OpenAI 公司开发的一系列具有革命性的自然语言处理(NLP) 模型。
2025-03-12 11:11:50
356
原创 提示词工程&RAG&微调:三种方式如何发挥语义大模型(LLM)的最大性能?
今天这篇文章的内容,依旧是讲述:如何通过Prompt工程,发挥LLM的最大性能。没有关注的朋友,可以点个关注,后续我还会更新更多关于AI的资讯及相关干货,别错过啦。Prompt工程概念:这是一种通过输入文本指令让AI大模型按照要求输出期望结果的技术。快速构建应用和性能基准提示词是调用AI大模型能力的接口,通过结构化精心设计的提示词可以大大提高大模型的准确性和相关性。相比其他技术,通过提示词工程优化LLM性能的门槛更低、成本也会更低。
2025-03-10 21:13:59
1014
原创 LeetCode 刷多少题能进大厂面试,零基础入门到精通,看这篇就够了!赶紧收藏!
先说结论,单独从算法面试角度来说,200 道热门题基本上就可以,如果数量达到 400 题就非常稳。那问题来了,需要刷哪些热门题?怎么刷?如何最快速度的刷?关于有哪些热门题,大家可以借助 CodeTop 这个网站进行参考,网站通过人工手动处理的方式,整理了近期会考察的热门题。再来聊聊如何刷题。目前市面上有不少 LeetCode 的题解,并且 LeetCode 官方也提供了不少优秀的文章。如果你自学能力强,有耐心慢慢的看别人的文章,同时有大量时间可以投入到刷题上,那么完完全全是可以自学的。
2025-03-10 21:08:01
669
原创 阿里开源QwQ-32B推理模型!32.5B vs 671B|仅需1/10成本
QwQ-32B的诞生标志着语言模型"深度思考"的质变。开源先锋,引领全球AI新格局。目前QwQ-32B开源后已经在HuggingFace全球模型趋势位列第一。QwQ-32B的开源标志着中国AI社区在高效推理模型领域取得重要突破。尽管在GPQA等专业基准上尚存差距,但其在AIME等临床推理任务的表现已展现巨大应用潜力。随着阿里巴巴持续迭代优化(GitHub仓库星标数已突破15k),该模型正在重新定义中等规模语言模型的性能边界。
2025-03-08 10:48:34
1062
原创 Manus一夜爆火,一码难求,有人开价5万元,网友急了:全网收集
3月6日凌晨或许是DeepSeek 之后,科技圈又一个不眠之夜,一款名为**“Manus”**迅速走红,全网刷屏。让Manus一夜“刷屏”的演示视频:受此影响,3月6日早盘,互联网、软件、计算机、ERP概念、AI智能体等板块亦是集体爆发。其中,ERP概念大涨超7%,早盘资金净流入近36亿元,AI智能体大涨5.6%,资金净流入超48亿元。Manus到底是“何方神圣”?日前,来自中国的创业公司Monica正式对外发布通用型AI Agent产品Manus。
2025-03-07 16:51:59
1178
原创 爆火的Manus,和它的三个争议
AI又双叒叕变天。有网友看完视频后感慨,从3月6日早上开始,Manus官网就一直处于崩溃状态,朋友圈,微信群里,到处都是求邀请码而不得的人。崩溃的Manus官网截图当天下午,闲鱼上关于Manus 邀请码的“离谱”售价许多人感慨,Manus的声浪比DeepSeek还大。那么,作为“第一个通用AI代理”,Manus和之前的那些大模型产品又有哪些不同?用官方的话说,“这不仅仅是一个聊天机器人或工作流,它是一个真正自主的主体,弥合概念和执行之间的差距,当其他人工智能知识在生产想法的时候,Manus交付成果。
2025-03-07 16:42:17
1235
原创 Manus:一场关于通用Agent的狂欢与泡沫
凌晨三点的中文科技圈,仿佛被一场突如其来的飓风席卷。所有人的社交平台时间线,都被一款名为“Manus”的通用Agent产品占据——铺天盖地的PR稿件、投资人亢奋的转发、技术极客的拆解分析,以及二手平台上炒至10万元的天价邀请码。这让人不禁想起OpenAI发布GPT-4时的盛况,但不同的是,这一次的叙事主角是一款由中国团队打造的“全球首款通用Agent”。在这场狂欢中,我与几位深耕AI领域的从业者深夜长谈,试图从喧嚣中剥离出Manus的真实轮廓。以下是基于技术逻辑、市场定位与行业趋势的深度拆解。
2025-03-06 20:21:00
948
原创 AI Agent 的「GPT 时刻」,Manus 炸醒整个 AI 圈!
案例给出的任务是分析过去三年中英伟达、迈威尔科技和台积电股票价格之间的相关性:众所周知这三支股票之间存在紧密的关联性,但对于新手用户来讲,很难快速将其中的因果关系整理清楚。而 Manus 的操作,与一个真正的股票经纪人非常相似,它。
2025-03-06 19:59:14
810
原创 LangChain教程:2万字免费开放,小白上车必看!
LangChain的prompt是一种可复制、可重复使用的制作提示模版的组件,每个提示模版都可以包含占位符,这些占位符可以在运行的时候被动态替换成实际终端用户输入的内容,最终形成调用模型时输入的内容。
2025-03-06 11:38:56
1757
原创 重磅!2024图灵奖颁给强化学习两位大神,AlphaGo、ChatGPT,DeepSeek背后功臣!
可能有些小伙伴对“强化学习”这个词还不太熟悉,这就来给大家科普一下:简单来说,强化学习就像训练小动物一样,通过奖励和惩罚来引导智能体学习,让它在与环境的互动中不断试错、改进,最终学会完成特定任务。•可以理解为我们想要训练的AI程序,比如下棋的AI、聊天机器人等。•智能体所处的世界,比如棋盘、互联网等。•智能体做得好时得到的正向反馈,比如下棋赢了、对话流畅等。想象一下,你教小狗坐下,做对了就给它零食,做错了就口头制止。
2025-03-06 10:51:14
654
原创 一文搞懂多模态学习(多模态融合 + 跨模态对齐)
直接建立不同模态之间的对应关系,包括无监督对齐和监督对齐。无监督对齐利用数据自身特性自动发现模态间对应关系,如CCA和自编码器;监督对齐则利用标签信息指导对齐,如多模态嵌入和多任务学习模型。不直接建立对应关系,而是通过模型内部机制隐式地实现跨模态的对齐。这包括注意力对齐和语义对齐。一、注意力对齐通过注意力机制动态地生成不同模态之间的权重向量,实现跨模态信息的加权融合和对齐。
2025-03-05 11:04:08
1097
原创 本地部署DeepSeek R1 + Ollama + XRAG:三步搭建RAG系统,并解锁全流自动化评测
如何科学的评估RAG系统,对于RAG系统的性能优化至关重要。为此,本文提供了一个详细操作指南,帮助用户使用Ollama本地部署最新的DeepSeek R1模型,并使用最新的XRAG1.0框架来构建RAG系统并评估你的本地RAG知识库系统。这一过程分为三个主要步骤:Ollama安装下载启动DeepSeek R1模型配置XRAG使用本地模型和知识库,运行评估以解锁全流程自动化评测能力。
2025-03-05 10:26:04
646
原创 零基础也能看懂的ChatGPT等大模型入门解析!大模型入门到精通,看这篇就够了!
GPT 对应的是三个关键概念:生成式(Generative)、预训练(Pre-Training)和Transformer。生成式(Generative):是指通过学习历史数据来生成全新的数据。当使用ChatGPT回答问题时,是逐字(或三四个字符一起)生成的。在生成过程中,每一个字(或词,在英文中可能是词根)都可以被称作一个 token。预训练(Pre-Training):是指预先训练模型。
2025-03-04 11:46:39
1497
原创 答应我,别再错过了,DeepSeek+coze,一键生成短视频,一天可以生产一百条
今天我要给大家分享一个超级无敌简单的工作流,简单到什么程度呢?就是你只需要喝杯咖啡的功夫,就能轻松搞定短视频制作!是不是很心动?先来看看效果,比如像这种视频,是不是都很吸引人?你可能会觉得这背后肯定有很复杂的技术,但我要告诉你,完全不是那么回事!这个工作流就是 Coze,它就像一个神奇的魔法棒,轻轻一挥,就能把你的想法变成一个个精彩的短视频。你不需要懂什么高深的技术,也不用熬夜加班,只要你会用手机或者电脑,就能轻松上手。
2025-03-03 11:28:40
983
原创 什么是大模型?一图全面了解大模型,附国内外知名大模型及240余家大模型清单!
AI大模型是“大数据+大算力+强算法”结合的产物,是一种能够利用大数据和神经网络来模拟人类思维和创造力的人工智能算法。它利用海量的数据和深度学习技术来理解、生成和预测新内容,通常情况下有数百亿乃至数万亿个参数,可以在不同的领域和任务中表现出智能。
2025-03-03 11:23:16
1271
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人