AI_Mind-优快云博客

原创 DeepSeek-R1：强化学习驱动的推理模型

为了使更高效的小型模型具备类似DeepSeek-R1的推理能力，DeepSeek团队直接微调了Qwen和Llama等开源模型，使用DeepSeek-R1生成的推理数据进行训练。例如，DeepSeek-R1-Distill-Qwen-7B在AIME 2024上的表现超过了QwQ-32B-Preview，而DeepSeek-R1-Distill-Qwen-32B在AIME 2024、MATH-500和LiveCodeBench上的表现明显优于以前的开源模型，并可与o1-mini相媲美。

2025-01-27 16:56:40 987

原创可解释性机器学习

通过技术标准化、以人为中心的设计、性能与透明度的优化，未来的AI系统将不仅提高人们对AI的信任度，还将帮助AI系统在更广泛的领域中得到安全、高效的应用。继上述比特币数据为例，下图反映的是“区块大小”对比特币价格影响的ICE图，其中浅蓝色线反映的是每个个体的条件期望图，深蓝色线反映所有个体的平均水平。LIME对某个特定样本的特征进行扰动，并观察模型的预测变化，从而揭示特征对该样本的预测结果的影响。在机器学习中，全局可解释性指的是对模型整体行为的理解和解释能力，即如何从全局角度解释模型的决策过程和预测方式。

2025-01-18 12:35:51 1025

原创 SmolAgents：Huggingface最新agent框架，三行代码快速构建agent

但是，由于调用工具完全是大模型自行实现，CodeAgent对大模型的能力、尤其是Code能力也提出了更高的要求，若模型能力较弱，则可能出现agent失败的情况。一种很自然的想法是，编程语言设计的目的就是为了成为表达计算机动作的最佳方式，如果JSON格式是大模型调用工具的最佳形式，那JSON也将是最主流的编程语言，但事实并非如此。高效的人工智能系统需要为大语言模型提供某种访问真实世界的方式，例如，获取外部信息的搜索工具，或者为了完成任务对某些程序采取行动的能力。可见，智能体自行编写了调用工具的代码并执行。

2025-01-11 20:35:10 2618 1

原创国产大模型 DeepSeek-V3

在 DeepSeek-V2 高效架构的基础上，DeepSeek-V3 还引入了无辅助损失的负载平衡策略，并通过动态调整专家偏置项，确保训练过程中的负载平衡，从而避免了传统辅助损失对模型性能的负面影响。在 Arena-Hard 基准测试中，DeepSeek-V3 对基线模型 GPT-4-0314 的胜率超过 86%。DeepSeek-V3 的基础模型是在以英语和中文为主的多语言语料库上进行预训练的，因此DeepSeek-V3主要在一系列以英语和中文为主的基准测试上评估其性能，同时也包括一个多语言基准测试。

2025-01-04 10:33:23 2444

原创快速回顾 OpenAI 12天发布会

在第一天的发布会中，OpenAI推出了全新的o1模型，声称是全球最智能的AI系统。总体而言，OpenAI的12天发布会展示了公司在人工智能领域的全面进步，从模型性能的提升到用户体验的优化，再到开发者工具的丰富，OpenAI正不断推动AI技术的边界，使其更加智能、高效和易于接入。ChatGPT Pro订阅服务的推出，使用户可以无缝访问多个高级模型，享受更为强大的创作和解决问题的能力，还包含了O1-mini、GPT-4o和Advanced Voice等多个模型的使用权限，为用户提供了更加全面和个性化的服务。

2024-12-28 12:05:28 878

原创 Gemini 2.0：面向智能体时代的全新 AI 模型

因此，如何在推动创新的同时，确保技术应用符合社会责任，将是未来大语言模型发展的核心。Gemini 2.0 Flash (实验版) 是在 Gemini 1.5 Flash 的基础上进行升级开发的，在同样快速的响应时间下，具有更强的性能。Project Mariner 作为一个使用 Gemini 2.0 构建的早期研究原型，它能够理解和推理浏览器屏幕上的信息，包括像素和文本、代码、图像和表单等网络元素，然后通过实验性的 Chrome 扩展程序使用这些信息来完成各种任务。

2024-12-22 16:47:27 1730

原创浅谈大模型之Agent(下篇)

随着人工智能技术的不断进步，大模型Agent已经成为了推动智能应用发展的关键力量，这些Agent不仅能够理解人类的语言，还能自主地执行复杂任务，从简单的聊天机器人到能够做出战略决策的企业级助手，大模型Agent正逐步改变着我们的生活和工作方式。本文通过两个实践案例，详细阐述了如何从0到1利用受限的FAQ文档和LLM能力，搭建一个智能问答Agent，供大家学习参考。专业性强对回答准确率高。FAQ文档用户的运维相关问题根据问题输出的答案。

2024-12-14 17:43:38 954

原创浅谈大模型之Agent(上篇)

近年来，随着计算能力的增强，研究人员训练出了更大规模的语言模型，这些模型通过在海量文本数据上进行训练，获得了强大的自然语言理解和生成能力，为构建复杂的智能体奠定了坚实的基础。在许多应用场景中，AI系统需要具备更高的自主性和智能性，以实现在动态变化的环境中自我适应并做出决策，而大模型Agent恰恰满足这一需求。此外，现代AI系统不仅处理文本，还需应对图像、音频乃至视频等多种类型的数据，大模型Agent通过整合多模态信息处理能力，能够在更广泛的场景中发挥效用。

2024-12-07 10:42:36 1442

原创大模型在推荐系统中的应用

大模型正在深刻改变推荐系统的运作方式。通过强大的语义理解和生成能力，大模型不仅提升了推荐的精准度，还拓展了推荐系统的应用范围。然而，面对计算资源消耗和隐私保护等问题，技术优化和规范化发展尤为重要。随着大模型技术的不断演进，一个更加智能化、高效化的推荐系统时代将全面到来。

2024-12-01 18:00:51 1759

原创 AI的自我陷阱：大型神经网络训练中的模型崩溃现象

实验结果如下图1所示，训练数据总量为n = 500，横轴表示训练数据仅在真实数据上完成，纵轴表示训练是在合成数据和真实输出的混合数据上完成的，从左到右三张图分别显示了不同合成数据的结果。10月7日，发布在arxiv上的一篇名为Strong Model Collapse的论文，由Meta 、纽约大学和加州大学洛杉矶分校的研究人员共同发表的研究表明在训练大型神经网络（如 ChatGPT 和 Llama）时，由于训练语料库中包含合成数据而导致的模型性能严重下降的现象，即模型崩溃（Model Collapse）。

2024-11-24 16:45:56 1328

原创 Claude 3.5 重大更新！超越 Openai-o1！

计算机使用技术的引入为 AI 的发展开辟了新的方向。这项技术使得 AI 能够直接与现有的软件和操作系统进行交互，类似于一个虚拟助手在用户界面上进行操作，而不再局限于模型调用预设的 API 或特定的指令。它在保持与前代相同成本和速度的同时，性能达到了前代最强模型 Claude 3 Opus 的水平，甚至在多项测试中超越了 GPT-4o-mini。Claude 3.5 Sonnet (new) 在各个领域都超越了前代版本，尤其是在它擅长的编程领域和工具使用任务中取得了显著进展。，标志着AI技术的一次重大飞跃。

2024-11-16 17:34:55 4237

原创 YOLO系列再创新高：迎接YOLO11的到来！

YOLO11在维持低延迟的同时，显著提高了检测精度，展现出卓越的性能平衡，这使得它更加适合应用于多样化的计算机视觉任务，特别是在那些对实时性要求较高的推理场景中表现突出。更为重要的是，YOLO11的优化使得即便在计算资源受限的情况下，它仍能保持高效的性能输出，这一点使其尤为适合在边缘计算设备以及云端服务器上进行高效推理应用。：凭借设计上的进步，YOLO11 在 COCO 数据集上获得了更高的 mAP 值，相较于 YOLOv8m 减少了 22% 的参数量，在保证计算效率的同时维持了高水平的准确性。

2024-11-02 10:27:04 1585

原创零一万物新模型Yi-Lightning：超越GPT-4o

10月16日，零一万物发布了最新的旗舰模型Yi-Lightning（闪电），在中国大模型中首度超越 GPT-4o。它在国际权威盲测榜单 LMSYS 上取得了显著成绩，超越了硅谷知名 OpenAI 的 GPT-4o-2024-05-13 和 Anthropic Claude 3.5 Sonnet，排名世界第六，中国第一。在中文子榜单上，Yi-Lightning 超越了 xAI 发布的 Grok-2-08-13 和智谱发布的 GLM-4-Plus 等国内外优秀模型，与 o1-mini 等模型并列全球第二。

2024-10-26 17:38:36 1681

原创特斯拉Optimus：展望智能生活新篇章

马斯克在活动中透露，特斯拉 Optimus 预计将在 2026 年开始量产，规模化生产的成本将在 2 万至 3 万美元之间，但更进一步的目标是将成本降到 1 万美元左右，将售价控制在 2 万到 3 万美元之间。尽管距离特斯拉 Optimus 真正走进千家万户还有一段时间，但从发布会上的展示和马斯克的信心中不难看出，特斯拉正在为未来铺路，而 Optimus，则是这条路上的关键一环。作为VR训练机器人的带头人，特斯拉在今年5月的一段公开的视频里揭露了训练的大致流程。从遛狗到看护儿童，甚至端茶倒水，穿针引线。

2024-10-20 20:28:07 789

原创 Kubernetes 网络安全的挑战与应对策略

（一）Kubernetes 网络架构Kubernetes 网络主要由 Pod、Service、Node 等组件构成。Pod 是 Kubernetes 中最小的可部署单元，包含一个或多个容器，容器之间共享网络命名空间。Service 为一组 Pod 提供了稳定的网络访问入口，通过负载均衡机制将请求分发到后端的 Pod 上。Node 是 Kubernetes 的工作节点，负责运行 Pod，不同的 Node 之间通过网络连接实现容器的跨节点通信。（二）Kubernetes 网络安全的重要性。

2024-10-13 20:08:56 1255

原创一文看懂OpenAI新发布最强模型ChatGPT:o1

该公司在博客中给出了 preview 和 mini 版的不同定义：为了给开发者提供更高效的解决方案，我们也发布了 OpenAI o1-mini，这是一个尤其擅长编程的更快、更便宜的推理模型。无论是应对复杂的数学问题，还是在编程、语言处理等领域展现出的出色表现，o1系列模型都彰显了其在深度推理和解决难题上的卓越实力。输入一个复杂的年龄谜题：当公主的年龄是王子的两倍时，当公主的年龄是他们现在年龄总和的一半时，公主就和王子一样老了。这些模型可以推理复杂的任务，并解决比以前的编码和数学模型更难的问题。

2024-10-07 14:40:22 3104

原创 2024年10个顶级开源大语言模型

Falcon 模型是在 RefinedWeb 数据集上训练的，该数据集包含高质量的网络数据，使其在性能上超越了在策划过的语料库上训练的模型。Llama 3.1 增加了对8种语言的支持，上下文扩展到128k，405B参数量的模型成为全球最强的开源大模型。GPT-4 凭借其超大规模的参数和改进的特性，适用于多种复杂任务，尤其是在需要语言理解、生成和推理的领域。Llama 3.1 凭借其庞大的参数规模、多语言支持和超长上下文处理能力，在开源社区中树立了新的标杆，适用于复杂、多样化的任务。

2024-09-21 18:12:14 4628 1

原创人工智能新法案：在技术监管中平衡创新与安全

2024年，继欧盟人工智能法案后，加州也推出了被称为 "安全创新与前沿人工智慧模型法案"（Safe and Secure Innovation for Frontier Artificial Intelligence Models Act）的SB 1047法案，这项法案的通过被认为是全球范围内对AI技术进行立法规范的一个先锋举措，目的是为最先进的AI系统建立严格的安全标准。具体来说，该法案要求AI开发者进行全面的安全测试，确保其模型不会被用于网络攻击、生物武器制造等高风险行为。

2024-09-15 11:37:33 2139

原创 Gradio：轻松构建功能丰富的web应用

Gradio是一个开源Python包，可以为机器学习模型、API或任何Python函数快速构建演示或web应用程序，然后可以使用Gradio的内置共享功能在几秒钟内通过公共链接共享演示。

2024-09-09 19:54:37 1611

原创从传统到智能：解析《黑神话：悟空》中的AI技术应用

作为一款文化产品，《黑神话：悟空》深刻挖掘了《西游记》这一经典作品的核心价值，通过创新性的叙事手法和视觉表现，为玩家呈现了一个充满想象力的神话世界。游戏中的角色设计、场景构建、故事情节等方面均汲取了中国传统文化的精髓，例如游戏中的建筑风格、服饰设计、音乐旋律等都蕴含着浓厚的传统艺术特色，这不仅让国内玩家倍感亲切，也让海外玩家对中国传统文化产生了浓厚的兴趣。面对国产3A游戏产业的巨大潜力，我们期待更多杰出作品的诞生，这些作品将共同促进文化的传播和行业的创新，引领我们进入一个文化创意的新时代。

2024-08-31 23:59:10 5210

原创斯坦福大学ECON295/CS323 2024 | 人工智能时代-谷歌前CEO施密特

因为观点太直接，说话太实在，施密特的分享上了新闻。在最近的一次斯坦福大学对谈中，前谷歌CEO 埃里克·施密特（Eric Schmidt）分享了他对人工智能发展的看法。如果你想与其他初创公司竞争，你不可能允许员工只在家办公或每周只来公司一天（“卷”才是企业唯一的出路）。系统中的上下文窗口长度的显著增加，这将对AI的处理能力产生深远影响。通过学习和反馈循环来执行复杂的任务，可自动完善其数据库。可能会遇到无法完全表征的知识系统，但我们理解它们的边界。：工作和生活的平衡，早点儿回家比赢得竞争更重要。

2024-08-26 20:59:00 340

原创谁将控制AI的未来？

基础设施决定AI的未来。如果我们想要一个更民主的世界，历史告诉我们，我们唯一的选择是制定一个AI战略来帮助实现它，而那些在AI领域领先的国家和技术人员有责任现在就做出这个选择。：中国社会科学院法学研究所的周辉在接受21世纪经济报道的专访时提到，美国发布的关于“安全、可靠和值得信赖的人工智能”的行政命令具有较强的前瞻性，未来可能出现“华盛顿效应”，重塑AI监管领域的新秩序。如果我们想确保AI的未来是造福尽可能多的人的未来，我们需要一个由美国领导的全球联盟，由志同道合的国家和创新的新战略来实现。

2024-08-18 11:03:37 924

原创 AI编译器：解锁机器学习性能的新钥匙

首先呢，就是根据机器学习框架编写的代码，转换为计算图，然后计算图输入到编译器前端，在前端经过静态分析，自动微分，中间表示的前端优化（比如类型推导，表达式简化等），其中这中间表示优化的过程有可能会反复多次，然后前端优化后的代码输入到编译器后端，后端对传入的计算图进行一些硬件相关的优化（比如硬件指令优化，数据排布优化等），然后通过算子的选择，最后再进行内存分配，然后通过硬件的驱动层，最后传入到不同的硬件设备上面运行。这样无论是新增硬件的支持，还是新增前端的支持，都可以尽可能地复用IR相关的部分。

2024-08-05 00:21:10 922 2

原创算力平台和算力卡租用体验

体验了其他功能后，数据管理功能还挺好，默认给了500G，比其他家要多不少，开发过程中产生的数据可以直接传输到文件存储里，然后直接下载到本地，相比之前在网盘里相互传输，这种方式便捷性大大提升（应该是超算传统基于IB的共享存储，性能比本地SSD存储要差点儿，不过也还好）。正因为资源比较便宜，已经关机的镜像所使用的机器可能已经被别人使用，因此原来使用的镜像就无法启动，如需使用，只能等这个机器上有空闲资源，或者把镜像保存，导出，迁移到其他机器上使用。2.大厂的产品划分很细，每个产品收点费，合计金额挺贵的。

2024-07-22 01:03:01 7396 1

原创中国大模型市场和AIGC产品评测分析汇总（信息收集）-2024上

在中国，入围的模型包括商汤日日新·商量、文心一言、通义千问、豆包、天工、中科闻歌、Minimax、腾讯混元、Moonshot、360智脑、紫东太初、智谱AI、讯飞星火以及百川智能等。在过去的几年里，随着计算能力的增强和数据量的爆炸式增长，人工智能尤其是机器学习领域迎来了前所未有的发展。进入2024年，全球大模型竞争态势日益加剧，随着GPT-4o、Claude3.5、Gemini1.5-pro和Llama3的发布，国内大模型同样在2024年上半年内进行了波澜壮阔的大模型追逐赛。

2024-07-14 20:03:01 1504

原创 Ubuntu部署Stable Diffusion WebUI应用

一般是显卡的显存太小导致的，如果GPU显存比较小，建议不要画太大的图片，如果只有4GB的显存，又要画2000*3000的图片，肯定会报错的。①检查库文件路径：确认 libgthread-2.0.so.0 库文件是否存在于系统中，并且在正确的路径上。这个报错是典型的显存不足，例如4GB显存的显卡，画968*968分辨率图像是正常的，画968*1152的分辨率图像也是正常的，画968*1264图像就报上面的错误了。①检查训练过程中的损失函数：如果在训练过程中发现损失函数溢出，这可能导致NaNs Unet报错。

2024-07-05 23:13:02 2057

原创引领未来：谷歌在I/O大会上发布新一代AI产品-下

谷歌还对其搜索引擎进行了全面的AI改造。从技术上讲，这个功能是通过 AI 逐帧分解视频，把每一帧的关键信息导入 Gemini 的长触点窗口挨个分析，并梳理网络中相关的文章、论坛、视频等，从中找到见解，以此实现了 Ask with Video 的智能建议。1.AI Review：用户可以通过在搜索结果的顶部，获取由 AI 大模型生成的摘要，以此简化整个搜索过程，让复杂问题的检索过程，变得简单。如上图所示，在发布会的实时演示里，AI 还把整个的修理步骤一一列出，按照屏幕上的指示，演示者很快就能解决小麻烦。

2024-05-23 22:37:21 1483

AI_Mind的博客