国产“小钢炮”MiniCPM3-4B:小参数,大能量!

前沿科技速递🚀

在 AI 大模型浪潮中,国内厂商面壁智能再次突破,推出了其最新的“小钢炮”系列——MiniCPM 3.0。这款全新模型不仅实现了在移动设备上运行 GPT-3.5 级别的能力,而且具备超强的推理、检索与代码解释功能。MiniCPM 3.0 以仅 4B 参数的“轻量级”模型,成功超越了 GPT-3.5,在移动端 AI 应用场景中展现出强大的实力。

来源:传神社区

01 模型介绍:从 MiniCPM 1.0 到 3.0

MiniCPM 3.0 是面壁智能“小钢炮”系列的最新版本,相比于前两代,3.0 版本在模型结构、性能优化和功能支持上都有显著提升。以下是对比三代模型的结构差异和关键改进:

  1. 位置编码机制:RoPE -> RoPE -> RoPE

    • 三代模型都采用了 RoPE(旋转位置编码),确保模型在处理长文本时能够高效地保留序列的位置信息,尤其是在处理超长上下文时表现更为出色。

  2. 注意力机制:MHA -> GQA -> MLA

    • MiniCPM 1.0 采用标准的多头自注意力机制(MHA),

    • MiniCPM 2.0 引入了分组查询注意力机制(GQA),提高了注意力计算效率,

    • MiniCPM 3.0 使用了 MLA(Multi-Level Attention),这一核心创新使得模型在复杂任务处理中的推理和生成能力更强,特别是长文本处理时性能更为稳定。

  3. 词表大小:123K -> 73K -> 73K

    • 从 MiniCPM 2.0 开始,词表大小被大幅精简至 73K,有效提高了模型的处理速度和多语言场景中的适用性。

  4. 模型层数:40 -> 52 -> 62

    • 随着版本迭代,模型层数逐步增加,提升了模型的复杂性与推理能力。

  5. 隐藏层节点数:2304 -> 1536 -> 2560

    • MiniCPM 3.0 的隐藏层节点增加至 2560,使模型的表现力和任务处理能力进一步增强,特别是在数据推理任务上表现更加优秀。

  6. 最大上下文长度:4K -> 4K -> 32K

    • MiniCPM 3.0 的上下文处理长度大幅提升至 32K,支持长文本的处理。这为模型在文档分析、写作工具等应用场景中提供了强大的优势。

  7. 系统提示词与工具调用能力:不支持 -> 不支持 -> 支持

    • MiniCPM 3.0 引入了系统提示词功能,并支持工具调用和代码解释器,使得模型能够通过自然语言交互执行复杂任务,特别是在工具调用上性能显著增强。

图片

02 核心亮点:打破性能与参数之间的界限

  1. 无限长文本处理,性能随文本长度延展

    • MiniCPM 3.0 引入了 LLMxMapReduce 技术,实现了无限长文本的处理能力。无论是 32K 还是 512K,模型都能高效处理长文本,并且在长文档场景中具备超强的性能稳定性。

    • 在长文本测试的 InfiniteBench Zh.QA 评测中,MiniCPM 3.0 甚至超越了 8B、9B 参数量级的对手 Kimi,展现出极为优异的表现。

  2. 端侧最强 Function Calling,媲美 GPT-4o

    • MiniCPM 3.0 是目前端侧设备上 Function Calling 性能最强的模型之一,能够精准理解用户输入,并转化为可执行的结构化指令。无论是调用日历、天气、还是手机中的文件和应用,MiniCPM 3.0 都能流畅响应。

    • 在 Berkeley Function-Calling Leaderboard 上,MiniCPM 3.0 的性能接近 GPT-4o,证明了它在工具调用上的实力。

      图片

  3. RAG 三件套:检索、排序、生成全能选手

    • MiniCPM 3.0 同时发布了 RAG(检索增强生成)三件套:MiniCPM-Embedding(检索)、MiniCPM-Reranker(重排序)和 MiniCPM3-RAG-LoRA(生成)。在多项检索任务中取得了 SOTA(State of the Art)的表现。

    • 经过 LoRA 微调后,MiniCPM 3.0 在开放域问答、多跳问答等任务上,超越了 Llama3-8B 和 Baichuan2-13B,成为中英文跨语言检索的领导者。

图片

03 MiniCPM性能评估

从评测数据中可以看出,MiniCPM3-4B 在多个评测集上的表现优越,尤其在整体性能和工具调用能力方面展现了明显的领先优势。

在综合评测的平均分上,MiniCPM3-4B 以 66.3 的得分超越了 Qwen2-7B(65.3) 和 GLM-4-9B-Chat(65.0) 等大模型,展现出强大的综合能力。与部分 7B、9B 参数的大模型相比,MiniCPM3-4B 的性能表现显著更好,尤其是在中文能力、数学能力等任务中优势明显。

在工具调用能力的评测中,MiniCPM3-4B 在 BFCL(Berkeley Function Calling Leaderboard)上的得分高达 76.0%,领先于 Qwen2-7B-Instruct(71.6%) 和 GLM-4-9B-Chat(70.1%) 等多个更大参数模型,表现出超强的工具调用能力。相比于其他大模型,MiniCPM3-4B 在这方面的领先地位使其在实际应用中更加高效、灵活。

图片

04 模型下载

传神社区:

MiniCPM3-4B:

https://opencsg.com/models/OpenBMB/MiniCPM3-4B

github:

https://github.com/OpenBMB/MiniCPM/

欢迎加入传神社区

•贡献代码,与我们一同共建更好的OpenCSG

•Github主页

欢迎🌟:https://github.com/OpenCSGs

•Huggingface主页

欢迎下载:https://huggingface.co/opencsg

•加入我们的用户交流群,分享经验

图片

扫描上方二维码添加传神小助手


“      关于OpenCSG

开放传神(OpenCSG)成立于2023年,是一家致力于大模型生态社区建设,汇集人工智能行业上下游企业链共同为大模型在垂直行业的应用提供解决方案和工具平台的公司。

关注OpenCSG

图片

加入传神社区

<think>嗯,用户想在Windows系统中删除指定路径下的文件,路径是F:\Users\TangWork\Desktop\YS626-锦星--钢炮--2022-05-11\Project\Objects\ft32f030x8_syscfg.d。首先,我需要确认几种常见的删除文件方法,确保覆盖不同用户的操作习惯。 首先想到的是使用文件资源管理器,也就是图形界面操作。用户可能更习惯这种方式,特别是对命令行不熟悉的用户。但路径中有中文字符和特殊符号,比如“锦星--钢炮--2022-05-11”,这里需要注意路径是否正确,是否存在空格或特殊字符导致的问题。不过Windows通常能处理中文字符的路径,只要用户直接复制路径粘贴过去应该没问题。需要提醒用户检查路径是否存在,以及文件是否被占用。 然后,考虑命令提示符中的del命令。这里需要注意的是,如果路径中有空格,必须用引号将整个路径括起来,否则命令会解析错误。比如del "F:\...\ft32f030x8_syscfg.d"。此外,可能需要管理员权限,特别是如果文件是系统文件或者被其他程序占用的话。这时候可能需要以管理员身份运行CMD。 接下来是PowerShell的方法,使用Remove-Item命令。PowerShell功能更强,处理路径的方式和CMD类似,但命令语法不同。同样需要处理路径中的空格和特殊字符,用引号包裹路径。这里还可以使用通配符,但用户的具体文件名已经很明确,可能不需要。 另外,用户可能需要强制删除只读文件或系统文件,这时候需要加上-force参数。但需要提醒用户谨慎使用,避免误删重要文件。 还要考虑文件是否正在被其他程序使用,如果删除失败,可能是文件被占用,需要关闭相关程序再尝试删除。或者使用第三方工具解锁文件,比如LockHunter,但一般不推荐用户随便安装软件,除非必要。 另外,用户提供的路径中有多层目录,需要确认用户是否有权限访问和删除该文件。特别是如果路径在系统保护目录下,可能需要管理员权限。 最后,可能需要检查路径是否正确,特别是用户手动输入时容易出错,建议复制粘贴路径。同时,提醒用户删除操作不可逆,需谨慎操作,确认文件不再需要。 生成相关问题的时候,应该围绕文件删除的其他情况,比如强制删除、删除只读文件、处理长路径问题,以及批量删除等,这些都是用户可能遇到的后续问题。</think>在Windows系统中删除指定路径文件的方法如下: ### 一、通过文件资源管理器删除 1. 打开文件资源管理器(Win+E) 2. 粘贴路径到地址栏: ```path F:\Users\TangWork\Desktop\YS626-锦星--钢炮--2022-05-11\Project\Objects ``` 3. 找到`ft32f030x8_syscfg.d`文件 4. 右键文件 → 删除(或直接按Delete键) *注意:如果提示文件正在使用,需先关闭相关程序* ### 二、使用命令提示符 1. 以管理员身份打开CMD 2. 执行删除命令: ```cmd del /F /Q "F:\Users\TangWork\Desktop\YS626-锦星--钢炮--2022-05-11\Project\Objects\ft32f030x8_syscfg.d" ``` - `/F`强制删除只读文件 - `/Q`安静模式不确认 ### 三、使用PowerShell 1. 以管理员身份运行PowerShell 2. 执行命令: ```powershell Remove-Item -Path "F:\Users\TangWork\Desktop\YS626-锦星--钢炮--2022-05-11\Project\Objects\ft32f030x8_syscfg.d" -Force ``` ### 常见问题处理 - 路径含空格必须加引号 - 系统文件删除需要`TrustedInstaller`权限[^1] - 长路径需启用长路径支持(注册表设置)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值