- 博客(917)
- 收藏
- 关注
原创 DeepSeek-V3-0324 发布,本次 V3 版本有哪些改进?
新一周的第一天,北京时间 3 月 24 日晚,DeepSeek 「突然」发布了模型更新。但暂时还不是 DeepSeek V4 或 R2,而是 DeepSeek V3 模型的一次更新。大家对这次「小版本升级」的 DeepSeek V3 模型体验如何呢?一起来看大模型、Python 话题领域优秀答主、答主与答主的回答吧~推理能力增强基准测试提升显著Web前端开发能力优化中文写作能力升级风格与内容优化功能增强中文搜索能力优化Function Calling 能力改进。
2025-04-01 10:37:53
537
原创 抖音电商如何用扣子 Coze 打造 AI 客服?
在传统电商客服体系中,服务流程通常由智能客服系统与人工客服团队协同完成,并衍生出一系列前后端的配套服务。尽管大模型已经诞生近两年半,目前 AI 客服大都还停留在 SOP 辅助模式或 Copilot 协作模式。“不配置就回复不了”、“机械式单轮问答”、“幻觉问题误导客户”、“无法识别判读意图,答非所问”等问题仍然普遍存在。为了让 AI 客服更智能化,抖音电商客服团队基于扣子Coze 平台,提供了 Agent 模式下的全新解决方案,在 AI 客服场景构建了人机协作的新型服务范式。
2025-04-01 10:35:11
885
原创 DeepSeek接入指南:电商卖家如何用AI替代90%人工客服?
2月份,韩束母公司上海上美股份的一张内部聊天信息截图在网上被疯传,内容显示,上美股份创始人、董事长兼CEO吕义雄对各部门下达裁员比例,要用AI替代人工,个别部门如客服淘汰率高达95%。一石激起千层浪,针对上述大规模裁员的传言,吕义雄在其朋友圈发文澄清表示,今年上美总体人数会增加800人,只是有些地方加人,有些地方减人,让运营更科学化,更有效率。实际上,从OpenAI推出的ChatGPT一夜之间火爆全球之后,有关AI的话题热度一直居高不下。
2025-04-01 10:34:07
470
原创 智谱AI悄悄发布AutoGLM,终于放大招了
他们发了一个AGI进程图,最好玩的还是用了《银河系漫游指南》里面那个终极答案42当了一个梗,而这个AGI进程图其实就是对标的人脑,而AutoGLM,就是AI,使用工具的能力。原始人类在70万年前,能走出非洲,依靠的,就是工具和火。而我,其实已经在3天前就拿到了AutoGLM的内测,在被封印了3天之后,也终于可以发出这篇文章。3天前第一次使用AutoGLM的那晚,它给我带来的震撼,给我带来的头皮发麻,到今天,我依然记忆犹新。现在,任何手机,你都可以把它,进化成贾维斯了。
2025-03-31 22:16:21
592
原创 实测AutoGLM沉思,AI牛马,能干活,会思考,不要钱
这个任务是 Manus 的示例任务,通过非常详细的指示,让 Agent 完成高度定制化的旅行方案规划,这样的规划在以往都需要专业的旅行规划师才能完成。报告很长,具体就不放了,直接截取一部分结果:AutoGLM 的完整报告在这里Manus 的在这里,可以作为对比replay=1体验 AutoGLM 沉思的过程,非常激动。因为我知道,就像 DeepSeek R1 是大部分读者对深度思考的第一次体验。AutoGLM 沉思将是大部分读者的第一次 Agent 体验。那种感受非常奇妙,请一定要试一试。
2025-03-31 22:15:09
392
原创 Text2SQL零代码实战!RAGFlow 实现自然语言转 SQL 的终极指南
在企业大模型应用方面,Text2SQL一直是应用热点。大家都希望小嘴一张,就完成一系列数据提取和分析工作。但是,使用大模型自动理解业务需求,实现 SQL 代码编写和代码执行一直都存在技术难点。传统的 Text2SQL 方案,往往依赖大模型微调,对于中小企业而言,带来非常高的应用成本。今天,介绍一个方法,使用开源 RAG 框架RAGFlow,应用知识库检索与大模型推理结合,不需要对模型做任何微调,只需要仅需配置少量结构化数据即可实现精准SQL生成,实现指定数据查询、负责查询、计算,跨表计算等多种场景。
2025-03-27 11:54:34
821
原创 Nat. Med. | 人工智能赋能药物开发:现状、挑战与未来趋势
2025年1月20日,四川大学华西医院杨胜勇教授、温州医科大学眼视光医院张康教授、温州医科大学李校堃院士和北京生命科学研究所黄牛研究员等人在Nature Medicine期刊上发表了一篇题为“Artificial intelligence in drug development”的研究文章。该文章深入探讨了人工智能(AI)在药物开发全过程中的应用,包括疾病靶点识别、药物发现、临床试验管理以及上市后监测等环节。
2025-03-18 10:58:07
494
原创 腾讯元宝接入DeepSeek-R1满血版,首次引入第三方模型,能联网能调用微信独家生态
拥抱的不光是DeepSeek,更是用户体验最佳的模型——不管是否是自家研发或者投资的。
2025-03-18 10:53:37
558
原创 多模态AI模型:读懂医学影像的超级大脑
2025年初,全球首款通过美国FDA认证的“AI放射学助手”横空出世。这款基于多模态大语言模型(LMMs)的系统,不仅能秒读CT/MRI影像生成诊断报告,还能结合患者病史提出治疗方案建议。在临床试验中,其对肺癌筛查的敏感度达到98.7%,误诊率仅1.2%,甚至比资深放射科医生还精准。这场由代码驱动的医疗革命,正悄然改变着300万放射科医生的职业命运。LLMs和LMMs在放射学和医疗保健领域的不同应用01 大语言模型:医疗领域的智能助手。
2025-03-17 21:31:01
1173
原创 IEEE TII | 论文荐读!对比学习+领域自适应!CTPA:对比时序预测自适应方法 , 用于工业时间序列的跨领域预测
所提出的CTPA方法能够将从一个条件(有标签的源域)学到的知识转移到另一个条件(无标签的目标域)。这种方法允许在源数据和目标数据之间发现相关性和域不变表示,同时保持每个域的固有结构。图1展示了CTPA的整体框架。CTPA的神经网络架构包括一个编码器、一个预测器、一个映射模块和一个对抗判别器。源模型通过使用有标签的源域数据进行监督预训练。预训练损失函数包括预测损失和对比域泛化损失。然后,预训练好的模型被转移到目标域,并将目标模型初始化为源模型。
2025-03-17 21:27:47
779
原创 搞懂推理大模型,看这篇就够了!
如果你从事人工智能(或一般的机器学习)工作,你可能对模糊且备受争议的定义并不陌生。“推理模型”这一术语也不例外。最终,有人会在一篇论文中正式定义它,但很快又会在下一篇论文中被重新定义,如此循环。在本文中,我将“推理”定义为回答需要复杂、多步生成并包含中间步骤的问题的过程。例如,像“法国的首都是哪里?”这样的事实性问题并不涉及推理。相比之下,像“如果一列火车以每小时60英里的速度行驶3小时,它会行驶多远?”这样的问题则需要一些简单的推理。例如,它需要在得出答案之前认识到距离、速度和时间之间的关系。
2025-03-14 10:37:07
371
原创 10几个国内AI大模型,让你的工作学习效率翻倍!
随着ChatGPT迅速走红,国内各大企业纷纷发力认知大模型领域。经过一段时间的酝酿,国内AI大模型也相继发布,快速点燃国内科技圈的热情。
2025-03-14 10:33:35
447
原创 2025年的风口!| 万字长文,带你纵观大模型Agent,涉及研究痛点、应用场景、发展方向
最近大家都在提Agent,例如AutoAgent、Dify、Manus等,突然想到一个问题,那么什么才是Agent,有没有明确的定义呢?为此关于Agent的定义,网上搜索了一圈,说其最早“Agent”这个词可以追溯到古罗马时期,并且还能够从一些哲学家的哲学作品找到影子。一篇文章中说Agent的哲学概念泛指具有自主性的概念或实体,它可以是人造的物体,可以是植物或动物,当然也可以是人。这定义挺好的,我没意见。感兴趣的小伙伴可以就这个定义去搜索了解一下,把故事线梳理清楚了可以整篇论文了。
2025-03-13 10:49:38
929
原创 deepseek+dify:爬取网站多篇文章,批量提取和输出热点摘要(一)
设想方案概述:Dify(迭代节点)+Firecrawl(网页抓取)+Deepseek(大模型)一)安装Firecrawl工具二)详细操作步骤第一步:创建Dify应用1. 点击创建工作流,命名 “AI资讯八爪鱼”2. 整体流程说明:开始节点 - 页面抓取 - 迭代节点(LLM节点) - 输出节点。第二步:配置开始节点第三步:配置网页工具节点选取 工具-firecrawl,选择“地图式快爬”(获取网站上所有的网址)。将输入变量设置为 开始节点的 URL参数;
2025-03-13 10:45:52
1789
原创 从国内爆红到国际冷场:Manus能否成为下一个DeepSeek?
Manus的崛起为国产AI智能体带来了新的希望,但其未来发展仍需在技术创新、生态圈融入和国际市场拓展等方面持续努力。如果能够克服这些挑战,Manus或许真的能够成为媲美DeepSeek的“国货之光”。
2025-03-12 11:39:56
860
原创 基于大模型的测试用例自动生成服务探索
通过上述示例,我们展示了大模型理解业务需求,识别测试要点并生成测试用例的过程。在需求文档比较详细的前提下,单个测试要点可以生成约3~5个测试用例,平均每个测试用例生成时间约5s左右(根据功能点的复杂度以及用例生成方法的不同而有所差异)。经过人工对多个需求的大模型生成的测试用例与手工撰写的测试用例进行对比测试,发现两者的用例相似度、匹配度较高,且大模型生成的用例可以基本覆盖业务重点流程和异常业务场景。
2025-03-12 11:36:15
769
原创 大模型入门的路很长,你敢走吗?零基础入门到精通,看这篇就够了!赶紧收藏!
作为大模型领域的“新兴战场”,越来越多的人在讨论如何入门、如何快速提升自己的能力。你是否也有过这样的困惑:想学大模型,但基础薄弱怎么办?到底该怎么学,才能在面试中脱颖而出?让我先给你一个简单的答案:学大模型不仅仅是做题、读文献那么简单,它关乎的是思维方式的转变,是对技术本质的深入理解。“大模型入门的路很长,你敢走吗?”首先,我得坦白说,大模型的学习不适合所有人,尤其是对于那些基础薄弱、没有相关项目经验的同学来说,这条路可能会比想象中的要艰难得多。有个朋友是26届的应届生,基础较为薄弱,没啥LLM(大语言模型
2025-03-10 22:02:33
2255
原创 人工智能大模型7大核心发展趋势!
*在文本能力上,**随着模型参数、训练数据和训练时间的增加,模型文本能力的上限不断刷新。**在多模态能力上,**实时对话延迟显著缩短;图片理解、视频生成、图像生成的基准测试最高分不断被突破。**在复杂思维能力上,**模型后训练从单次采样转化为思维链强化和规模化采样,大模型应对代码、数学等高阶推理能力快速演进。**模型处理容量上,**大模型的上下文窗口不断扩大,上下文窗口中位数已达128k,闭源最大已达200万。
2025-03-10 21:59:40
955
原创 阿里发布最新开源推理模型,“性能比肩DeepSeek-R1”
阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。3月6日凌晨,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B。据介绍,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1,同时大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。QwQ-32B采用了Apache 2.0开源协议,目前,所有人都可免费下载及商用QwQ-32B模型,或通过网页版Qwen Chat进行体验,该模型也将免费上架通义APP。
2025-03-08 11:31:10
638
原创 QwQ-32B一键部署!真正的0代码,0脚本,0门槛
您可以自定义模型的系统提示词、函数调用、温度k等配置,调出最适合自己的模型参数。此外,OpenWebUI还有个性化知识库、AI对话游乐场等功能,您可以在官方文档[6]中继续探索!附录。
2025-03-08 11:27:38
1481
原创 Manus:通用AI Agent的野心与现实
昨晚,Monica团队推出的新产品Manus在AI圈引起广泛关注。卡兹克、赛博、小互等大号的宣传体验稿铺天盖地而来,Manus被描述为"真正自主的AI Agent",不仅能提供建议,还能直接交付完整任务成果。
2025-03-07 17:25:06
633
原创 为什么Manus底层模型没用DeepSeek?——Manus六问六答
在Manus迅速出圈之后,各种信息漫天飞舞,有严肃分析和解读,但并不多,更多的是各类博主(特别是短视频博主)震惊体式的摇旗呐喊。那么在Manus各类信息过载的同时,潘寒试图从各种信息中抽出部分有价值的进行分析,总结了六个问题。力求让读者看懂“是什么”之后也真正搞懂“为什么”,同时在眼花缭乱的AI信息爆炸中破除FOMO焦虑——一、为什么Manus底层模型没用DeepSeek?Manus各类出色任务背后到底用了什么模型?
2025-03-07 17:09:05
779
原创 关于Manus我们所知道的一切,一个和DeepSeek截然相反的产品故事
Manus爆火之后,网络上对他的评价开始两级分化。一方面,许多业内人士和科技爱好者对这款通用AI Agent的出现充满期待,认为它代表了人工智能领域的重大突破。另一部分则指责Manus过度营销。一款新产品刚亮相,就让整个 AI 圈陷入“抢号大战”,究竟是技术革命的前奏,还是又一场饥饿营销的极致演绎?。先说结论,Manus 是一个不错的产品。但**并不算是一项技术突破。**一是它主要依赖于预设的流程来执行任务。尽管在短期内确实能让系统表现得更好,这种预定义的流程会严重限制系统的上限性能。
2025-03-06 20:34:56
1122
原创 一夜之间火爆全网!又一个中国AI产品刷屏
并且,不同于此前各类功能相对简单的人工智能助手,Manus拥有具备超强学习能力和适应性的“数字大脑”,不再局限于单一任务,而是能够理解复杂指令、自主学习、跨领域协同,真正像人一样思考和行动。
2025-03-06 20:30:25
821
原创 视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源
今天给大家重磅推荐一个突破性的视觉强化微调开源项目 —— Visual-RFT (Visual Reinforcement Fine-Tuning)。论文地址: https://arxiv.org/abs/2503.01785代码地址: https://github.com/Liuziyu77/Visual-RFT。
2025-03-06 11:49:36
802
原创 【DeepSeek微调教程】小白也能学会的DeepSeek微调详细步骤,从零到一,个人低配置笔记本可操作
可能大多数同学都像我一样,没有GPU,手头上也只有一台小破笔记本,又不想花钱买显卡买设备买云服务器。本文就带大家在这种条件下,实战一下微调 DeepSeek。
2025-03-06 11:45:58
1282
原创 如何构建自己的大模型,大模型零基础入门到精通,收藏这一篇就够了!
如今大模型百花齐放,关于大模型的文章也非常多,但是介绍如何从0开始构建自己的大模型的介绍比较少,本文系统性地介绍了如何选择合适的基座模型,以及如何使用自己的数据微调大模型。
2025-03-05 11:33:09
1719
原创 AI模型训练到底在训练什么?AI模型训练零基础入门到精通,看这篇就够了!
AI 模型训练是指通过数据驱动的方式,让人工智能(AI)系统从经验中学习,以便在给定的任务上进行预测、分类或生成等操作。这个过程通过优化模型的参数(如神经网络的权重和偏置)来最小化预测误差或损失,从而使模型能够在新数据上做出准确的判断,本文将介绍AI模型中神经网络和神经元的构造,以及AI训练的原理。👀。
2025-03-05 11:14:37
798
原创 自己电脑搭建个人知识库,一般电脑也能玩(支持通义千问、GPT等)。零基础入门到精通,看这篇就够了!赶紧收藏!
既不花钱,一般电脑又能玩的方案,一句话总结:本地大模型(qwen:7b)+ 文档搜索工具(whoosh)使用此方案搭建的LLM+个人知识库,网页界面demo如下:若提问内容在我们的文档系统中,输出哪些文档命中,包括内容,然后大模型Qwen自动对内容进行深度分析。总体来说,这种模式充分发挥了高性能检索+LLM问答的两者优势,用起来还是挺舒服的。
2025-03-04 11:35:43
1278
原创 一文看懂Agentic AI、AI Agents和Agents:别再傻傻分不清了!
Agent作为一个热门概念,已经被过度使用和炒作,一些成熟产品选择回归本质,强调其实际价值而非概念标签。而且相比于需要学习如何与Agent互动,用户更愿意使用看起来像传统工具但具备AI能力的产品。
2025-03-04 11:28:35
963
原创 2025年大模型十大发展方向
为AI Agent研发的Agent AI人们期望AI能够像人类一样高效地使用工具,但当前的AI系统缺乏这种能力,需要借助代理服务来操作接口和访问数据。通过这样的代理机制,AI得以理解用户需求、分解复杂任务、规划多步骤流程并执行具体动作。这种具备代理功能的智能系统被称为“AI Agent”,它之所以受到广泛关注,是因为其能够在人机交互中扮演关键角色,显著提升自动化处理的效率与灵活性。
2025-03-03 11:51:18
792
原创 10分钟搞定,DeepSeek+Ollama+AnythingLLM 本地部署完全指南,打造专属知识库。
1、列出本地可用的模型列表:ollama list2、启动模型:ollama runmodel_name3、查看模型信息:ollama showmodel_name4、删除指定模型:ollama rmmodel_name2 部署AnythingLLM2.1 下载安装打开官网地址:https://anythingllm.com/desktop,根据自己的系统选择下载的版本。默认路径安装,或者修改默认安装路径都可以。安装完成界面:点击完成自动跳转到AnythingLLM界面。
2025-03-03 11:48:23
1473
原创 DeepSeek接入远程算力,管理个人知识库,确实可以封神了!
这段时间有读者跟我留言反馈了一个问题,就是自己电脑即便运行deepseek-r1最小的1.5b模型,提问它一个问题,也迟迟无法得到回复,好像完全卡顿在那里。这个问题还不是个别人遇到过,貌似还挺多的,所以今天这篇文章来探索一个对此问题的解决方法。尤其是个人电脑配置不是很好,比如不带GPU显卡,而是传统的intel显卡的电脑,无法运行大模型的,可以好好看看。除此以外,这篇文章还会介绍如何借助大模型搭建个人知识库。
2025-02-28 21:15:13
1280
1
原创 OpenAI,最新发布
2月28日,OpenAI发布GPT-4.5。OpenAI称,这是迄今为止最大、最好的聊天模型,其知识面更广,对世界的理解更深,从而减少了幻觉,在各种主题上的可靠性更高。值得注意的是,OpenAI联合创始人、首席执行官萨姆·奥尔特曼近期与Meta在社交平台X上进行过“交锋”,Meta计划发布独立的AI应用,奥尔特曼则回应要做社交软件。这可能标志着AI公司间的竞争正趋于激烈,或将推动AI产业进入实用性与生态协同新阶段。
2025-02-28 17:25:06
1001
原创 基于 Deepseek LLM 本地知识库搭建开源方案(AnythingLLM、Cherry、Ragflow、Dify)认知
本地 LLM 部署LLM 本身只是一些神经网络参数, 就拿 DeepSeek-R1 来讲,模型本身存储了, 实际运行起来需要行业级别的服务器配置, 消费级别的个人电脑不能直接运行,实际还涉及到硬件适配,需手动配置环境,编写分布式推理代码,处理量化与内存溢出问题现在通过ollama可以在消费级别电脑部署,上面涉及到的问题ollama帮我们完成,同时还涉及模型的管理,推理服务构建ollama开源项目地址: https://github.com/ollama/ollamaollama安装。
2025-02-27 11:04:25
1112
原创 小米AIGC产品经理上岸面经(已拿offer)
🌟学历:本科🌟专业:电子信息科学与技术🌟性别:女🌟年龄:29🌟婚育:已婚未育🌟工作经验:5年🌟职业情况:金融产品经理,想要转AIGC产品经理自认为产品经理相关的技能是完全没问题的,最开始没有AI相关的项目经验,投递了50多家一个面试都没拿到,我过段暂停了简历投递,因为我发现AI项目经验就是敲门砖,如果没有的话投递再多都是在浪费机会。后来补充了两个AIGC的项目:AI智能催收系统和AI智能投顾系统,才逐步开始有了面试。
2025-02-27 10:39:13
1217
原创 DeepSeek成24小时在线的AI医生!网友:比真人耐心,但误诊了该找谁?
最近DeepSeek可以说是接天接地啥都接了,但凡是个产品都在尝试接入。我还刷到这样一条热搜:北京某三甲医院的神经外科主任医师分享了一个特别案例,他和DeepSeek AI合作诊断了一位复杂脑瘤患者。让我惊讶的是,热搜中从业二十年的医生还评价说DeepSeek有省级三甲医院专家水平!还有广东一位医学博主“孤芳自赏”也分享了这样一个例子:这位医生最后发现,DeepSeek的建议基于最新诊疗指南,咱们可能都经历过这样的场景:凌晨的医院走廊里,家长抱着高烧的孩子焦灼等待;
2025-02-26 11:40:04
651
原创 写给小白的大模型入门科普
1. 什么是大模型?大模型,英文名叫Large Model,大型模型。早期的时候,也叫Foundation Model,基础模型。大模型是一个简称。完整的叫法,应该是“人工智能预训练大模型”。预训练,是一项技术,我们后面再解释。我们现在口头上常说的大模型,实际上特指大模型的其中一类,也是用得最多的一类——语言大模型(Large Language Model,也叫大语言模型,简称LLM)。除了语言大模型之外,还有视觉大模型、多模态大模型等。现在,包括所有类别在内的大模型合集,被称为广义的大模型。
2025-02-26 10:52:10
703
原创 大模型概念、技术与应用实践(140页PPT读懂大模型)
大模型,通常指的是大规模人工智能模型,它们基于深度学习技术,拥有海量参数、卓越的学习能力和广泛的泛化能力,能够处理并生成多种类型的数据。大模型的“大”主要体现在参数数量巨大、训练数据丰富以及计算资源需求高等方面。这些模型,如OpenAI的GPT-3(参数规模达1750亿)、GPT-4(参数规模超1.8万亿)以及阿里的M6(参数量达10万亿),均需庞大的计算资源和存储空间进行训练和存储,并常采用分布式计算和特殊硬件加速技术。
2025-02-26 10:44:35
1633
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人