Menlo/Jan-nano-gguf：优化工具调用方向的热门模型

最新推荐文章于 2025-11-26 15:49:07 发布

原创

最新推荐文章于 2025-11-26 15:49:07 发布 · 471 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能

🧠 一、模型基础信息

核心定位与架构

· Jan-nano 是由 Menlo Research 开发的一款紧凑型大语言模型（仅 40亿参数），专为深度研究任务优化。

· 基于 Qwen3-4B 模型微调，采用 DAPO技术（Domain-Adaptive Pretraining Optimization）提升工具调用与信息关联能力。

· 支持 GGUF量化格式，便于本地部署与低资源运行。

核心技术创新

· MCP（模型上下文协议）架构：支持自主调用搜索工具，实现实时信息检索与跨源数据关联分析。

· 工具调用能力：在 Hugging Face 工具使用评测中超越 DeepSeek-R1-671B 等大模型，成为小型模型中的性能标杆。

📊 二、性能表现与评测

基准测试成绩

测试项目 Jan-nano得分对比模型（得分）
SimpleQA 80.7 DeepSeek-671B (78.2)
MCP工具调用领先 DeepSeek-v3-671B
（数据来源：）

效率优势

· 在同等任务下，40亿参数的 Jan-nano 推理效率显著高于百亿级模型，适合预算有限的科研场景。

⚙️ 三、部署与使用指南

模型下载地址

· 基础模型：Hugging Face →

· GGUF量化版：Hugging Face →

量化版本建议

· 优先选择 Q8量化（8-bit），低比特版本（如Q4/Q5）可能导致质量显著下降。

本地运行方案

· 推荐工具：

· Jan AI：原生支持 GGUF 模型，提供可视化界面（）。

· Ollama：通

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

老兵发新帖

关注关注

5
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

自然语言处理之命名实体识别：Bi-LSTM模型的训练与优化

zhubeibei168的博客

04-17

1222

在自然语言处理（NLP）任务中，尤其是命名实体识别（NER）领域，模型的性能评估至关重要。常用的评估指标包括准确率（Accuracy）精确率（Precision）召回率（Recall）和F1分数（F1-Score）。准确率（Accuracy）：所有预测正确的实体占总预测实体的比例。然而，在类别不平衡的数据集中，准确率可能不是最佳的评估指标。精确率（Precision）：预测为实体的项中，实际为实体的项所占的比例。

针对深度研究任务的开源4B模型速览：Jan-nano

直达开源前线，冲冲冲！

06-17

567

Jan-Nano是一款专为研究任务设计的40亿参数语言模型，由Alan Dao等人开发。该模型与MCP服务器深度集成，在SimpleQA基准测试中展现出良好的工具增强研究能力，同时确保事实准确性。目前可在Jan-beta本地AI平台上运行，支持用户隐私保护。vllm工具提供模型启动命令，社区也提供相关讨论和非Jan应用指导。模型论文中包含核心技术汇总表格，展示了其创新特点。

参与评论您还未登录，请先登录后发表或查看评论

2.5k 个问题！HLE 突破性构建大语言模型精准评估体系；40 亿参数轻量级大语言模型 Jan-Nano，专为深度研究任务设计

HyperAI超神经

07-21

980

近年来，大语言模型（LLM）取得了突破性进展，能够胜任解答问题、内容创作等多样化任务，展现出了强大能力。Benchmark 作为评估 LLM 发展能力的重要工具，对于 LLM 的能力改进与提升具有参考性意义，但目前热门 Benchmark 在难度设计方面存在欠缺，表现为前沿 LLMs 在现有的许多评估中均取得相近且较高的评分，导致 LLM 能力衡量准确性受限，也因此模糊了大模型的能力提升空间。

Menlo Research新突破：4B参数的Jan-nano如何用“搜索能力“击败671B参数巨无霸模型

weixin_49122920的博客

07-02

607

在完整SimpleQA数据集上，Jan-nano在smolagents CodeAgent框架下达到76.2%的准确率，而在LangGraph MCP框架下达到80.7%的准确率，显示了4.5个百分点的性能差异。83.2%的准确率不仅超越了许多参数规模远超自己的模型，更重要的是展现了"小而精"设计理念的巨大潜力。类似的问题在另一个案例中也有体现。模型的128K上下文长度版本在SimpleQA基准测试中表现出比标准版本2.5个百分点的提升，达到83.2%的准确率，表明扩展上下文长度对这类基准测试是有益的。

善于处理复杂任务的紧凑型语言模型：Jan-nano-128k

直达开源前线，冲冲冲！

06-28

380

Jan-Nano-128k是一款突破性的紧凑型语言模型，原生支持128k上下文窗口，解决了传统方法在长文本处理中的性能下降问题。该模型能高效处理研究论文、长文档和多轮对话，在SimpleQA基准测试中表现优异。通过MCP服务器兼容性测试，其性能优于前代模型。提供VLLM和llama-server两种部署方案，并推荐了温度0.7、Top-p 0.8等采样参数。该技术突破使模型在深度文档分析和复杂推理任务中展现出显著优势。

notepad--字体渲染优化：高清屏幕适配方案

gitblog_01005的博客

09-08

419

你是否在4K显示器上使用notepad--时遇到过字体模糊、界面错位的问题？是否因不同操作系统下字体渲染效果不一致而困扰？本文将深入剖析notepad--在高清屏幕适配中的核心问题，提供一套完整的字体渲染优化方案，帮助开发者和用户获得清晰锐利的文本显示效果。读完本文你将掌握： - notepad--字体渲染的底层原理与现有问题 - 跨平台DPI适配的实现方法 - 字体抗锯齿与Hinting技术...

Bootstrap-sass字体系统详解：自定义字体集成与优化

gitblog_00494的博客

10-14

959

在Web开发中，字体不仅是内容的载体，更是视觉体验的核心元素。Bootstrap-sass作为流行的前端框架，其字体系统兼具灵活性和易用性，却常常被开发者忽视。本文将深入解析Bootstrap-sass的字体架构，从默认图标字体到自定义字体集成，带你掌握字体优化的全流程，解决中文显示异常、加载性能瓶颈等实际问题。 ## 字体系统核心架构 Bootstrap-sass的字体系统基于Sass（Sy...

menlo-one-token:MenMenlo ONE令牌源代码-one source code

03-24

Menlo ONE代币 ONE代币和众筹的智能合约。合约书请参阅目录。伪像请查看目录。 ONE代币 ONE令牌的合同地址为： 0x4d807509aece24c0fa5a102b6a3b059ec6e14392 单击此处以查看的。该守则已由审核，。背景 ...

各种字体_编程字体_roboto_Droid-Sans-Mono_Menlo_Source-code-pro

02-09

这些字体都是专为代码编辑器和开发环境设计的，旨在提供清晰的视觉体验，减少眼睛疲劳，并优化代码的可读性。 Roboto是一款由Google设计的通用字体，虽然它最初并非专为编程设计，但其简洁明快的线条和良好的屏幕...

/Users/wxb/miniconda3/lib/python3.10/site-packages/IPython/core/pylabtools.py:152: UserWarning: Glyph 27835 (\N{CJK UNIFIED IDEOGRAPH-6CBB}) missing from current font.

08-11

- **Menlo**（macOS）在终端设置中将字体更改为上述任意一种，并确保其支持 Unicode 和所需的字符集。 #### 2. 配置 IPython 使用 ASCII 替代输出如果无法更改字体，可以通过配置 IPython 禁用 Unicode 输出，...

基于学习的人工智能（1）为什么学习？

致力于大数据+AI 的应用创新。

11-24

271

学习是人类最重要的认知活动之一，贯穿我们的一生。出生后，我们无时无刻不在学习：从父母那里学说话，自己尝试走路，从小伙伴那里学会折纸飞机，从老师那里学到语文、数学等各种知识。研究人员始终将光源和风扇放在同一侧，经由学习，玉米幼苗逐渐学会了“有风的地方就会有光”的规律。之后，研究人员移去光源，并改变风扇方向，玉米幼苗依然按照所学知识，向风扇方向生长。1959 年，美国计算机学家亚瑟·塞缪尔设计了一款可以自我学习的跳棋程序，并将这一新方法称为“机器学习”，从而开启了机器自我学习的道路。

三大空间信息焕新：辉视让酒店服务、教育通知、监所管控更智能高效

CalebLXL的博客

11-24

705

走访这些场所后我发现，系统的真正价值不在于那些炫目的屏幕，而在于它构建了一套"空间信息免疫系统"——就像人体淋巴网络般，能智能识别各区域的信息需求，精准输送"营养"，快速清除"毒素"。当我们在酒店大堂不再错过末班机场大巴，在学校走廊偶遇恰好需要的竞赛通知，甚至在高墙内获得规整的信息权时，或许该重新思考：所谓智能化，本质是对空间信息代谢效率的一次外科手术式改造。这种荒诞的割裂感，正是传统信息分发模式崩溃的缩影——直到我最近走访数家采用辉视系统的场所，才意识到我们早已进入"精准信息触达"的新纪元。

（116页PPT）关于5G和新基建赋能智慧工地整体解决方案（附下载方式）

2501_92808811的博客

11-25

435

在整体架构方面，方案以“5G智慧工地平台”为核心，依托多类感知设备（如传感器、摄像头、AI眼镜、智能安全帽等）采集数据，通过5G网络实时回传至云平台，再借助大数据、云计算、人工智能等技术进行分析处理，最终在PC、手机、监控大屏等多终端进行可视化展示。此外，文件还详细列举了传统智慧工地子系统（如深基坑监测、升降机监控、扬尘噪音监测、智能水电计量等）的功能与部署方式，并补充了如5G企业专网、实测机器人、智慧科技体验中心等延伸应用，体现出方案的系统性与前瞻性。详细资料请看本解读文章的最后内容。

信息检索13

最新发布

2301_80828873的博客

11-26

897

最近邻检索的方法，PQ，IVF,HNSW

RAG 的诞生：为了让 AI 不再“乱编”

weixin_44876263的博客

11-24

652

RAG全称，中文为“检索增强生成”。其核心思想是：在生成答案时，不仅依赖大模型内部的训练知识，还能够实时访问外部知识库或文档，从而生成更加准确和可靠的内容。就像一个学生回答问题，不仅依靠自己记忆，还会去图书馆查资料，然后结合记忆和查到的资料回答问题。你问模型：“请告诉我最新的新能源补贴政策。纯模型可能只靠训练记忆，回答的是过时或模糊的信息。RAG 模型会先去查最新政策文件，再结合训练知识生成答案，因此更准确。检索资料：先找到相关文档或信息。结合生成：把找到的资料和问题一起输入模型，让模型生成答案。

【LoRA（低秩适应）技术详解：原理、公式与实践】

m0_46882548的博客

11-26

680

参数高效：可训练参数量通常仅为全量微调的0.01% - 3%，极大降低了计算和存储成本。内存友好：由于大部分原始权重被冻结，无需存储其优化器状态，显著减少了训练时的显存占用。无推理延迟：训练后可将LoRA权重合并回原模型，推理速度与原始模型一致。模块化与灵活性：一个基础模型可以搭配多个针对不同任务的、体积很小（几兆字节）的LoRA适配器，轻松切换任务。减轻灾难性遗忘：因为原始权重基本不动，模型在适应新任务时更不容易遗忘预训练时获得的通用知识。

【NullSwap】NullSwap: Proactive Identity Cloaking Against Deepfake

人生不是轨道，是旷野。希望每天都有好心情。

11-23

382

由于生成模型的进步，被动检测高质量Deepfake图像的性能瓶颈，主动扰动提供了一种有前途的方法，通过将信号插入良性图像来禁用Deepfake操作。【生成模型的发展，使得生成高质量伪图越来越难被检测】然而，现有的主动扰动方法在以下几个方面仍然不能令人满意：【当前主动扰动存在的问题】1）由于直接元素添加而导致的视觉退化;2）对交换操纵的有效性有限;3）不可避免地依赖于白盒和灰盒设置，以在训练期间涉及生成模型。我们分析了深度伪造swap技术的本质，并论证了保护源身份而非目标图像的必要性。

强化学习人形机器人奖励函数分析

ModestCoder_的博客

11-23

1056

PPO (Proximal Policy Optimization) 是一种 Actor-Critic 架构算法。奖励函数是整个学习过程的指挥棒。学习预测未来的累积回报（Return）。用于处理物理限制的软约束，形式通常为单边损失（Hinge Loss）。，作为 Cost/Penalty 使用，用于约束能量和保持稳定。以下是代码中各个奖励项的数学表达及其物理含义分析。形式，旨在最大化机器人对指令的跟随精度。这种设计是现代机器人控制领域的标准范式。形式，在总奖励计算中通常会被赋予。

教你使用服务器搭建一款一款端到端的开源 OCR 模型GOT-OCR2.0

m0_69484557的博客

11-25

278

GOT-OCR2.0 是一款真正专业级、可落地的端到端开源 OCR 模型，它让文档识别变得更智能、更精准、更高效。当你将它部署在莱卡云服务器上后，就拥有：一个稳定的 OCR 服务平台一个云端智能识别中心一个支持批量处理的高效工具一个可扩展的文档自动化系统。

JetBrainsMono-Consolas-Menlo混合字体：编程等宽字体新选择

### JetBrainsMono-Consolas-Menlo混合字体介绍 JetBrainsMono-Consolas-Menlo混合字体，通常简称为JbmCM，是一种针对编程设计的等宽字体。等宽字体意味着每一个字符占用相同的空间，这对于编写代码非常有帮助，...