开源顶流集结！QwQ-32B 解锁多元玩法，OpenManus 低成本构建 AI 智能体！vLLM v1 赋能高效模型推理

本文链接：https://blog.youkuaiyun.com/HyperAI/article/details/146259504

在人工智能领域持续突破的浪潮中，Qwen 团队最新发布的模型 QwQ-32B，以 320 亿参数规模，再次刷新行业对开源大模型的认知。该模型在代码生成、多轮对话等任务中展现出了卓越的表现，推理能力更是比肩满血版 DeepSeek-R1。

此前不久，专为大模型加速推理的 vLLM 核心架构迎来重大更新。 其通过优化执行循环、统一调度器和零开销前缀缓存等技术，在吞吐量和延迟上实现了高达 1.7 倍的性能提升，使 QwQ-32B 在双卡 A6000 显卡上即可实现高效部署。

而在 AI Agent 领域，OpenManus 自推出以来势头迅猛，这个被称为「Manus 平替」的开源项目，不仅以技术复现回应了外界对封闭生态的质疑，更以模块化设计和工具链整合，为开发者提供了低成本构建智能体的「万能钥匙」。

目前，HyperAI超神经分别上线了「使用 vLLM 部署 QwQ-32B」和「OpenManus + QwQ-32B 实现 AI Agent」2 个教程，快来试试吧~

使用 vLLM 部署 QwQ-32B

在线使用：https://go.hyper.ai/8nPfC

OpenManus + QwQ-32B 实现 AI Agent

在线使用：https://go.hyper.ai/GIX1H

3 月 10 日-3 月 15 日，hyper.ai 官网更新速览：

优质公共数据集：10 个
优质教程精选：4 个
社区文章精选：6 篇
热门百科词条：5 条
3 月截稿顶会：4 个

访问官网：hyper.ai

公共数据集精选

1. Big-Math 强化学习数学数据集

Big-Math 是一个大规模、高质量的数学数据集，专为强化学习 (Reinforcement Learning, RL) 在语言模型中的应用而设计，数据集包含超过 250k 个高质量数学问题，每个问题都配有可验证的答案。

直接使用：https://go.hyper.ai/qtlbQ

在这里插入图片描述

数据集示例

2. JMED 中文真实医疗数据数据集

JMED 数据集是一个基于真实世界医疗数据分布的新型数据集。该数据集源自京东健康互联网医院的匿名医患对话，经过过滤以保留遵循标准化诊断工作流程的咨询。

直接使用：https://go.hyper.ai/FjZsa

在这里插入图片描述

数据集构建流程图

3. R1-Onevision 多模态推理数据集

R1-Onevision 数据集旨在赋予模型高级的多模态推理能力，它通过在自然场景、科学、数学问题、基于 OCR 的内容和复杂图表等多个领域的丰富、上下文感知的推理任务，弥合视觉和文本理解之间的差距。

直接使用：https://go.hyper.ai/jLbSI

在这里插入图片描述

数据集结构

4. NaturalReasoning 自然推理数据集

NaturalReasoning 数据集是一个大规模、高质量的推理数据集，它包含 280 万个挑战性问题，这些问题覆盖了多个领域，如 STEM 领域（例如物理、计算机科学）、经济学、社会科学等。该数据集旨在通过利用预训练语料库和大型语言模型 (LLMs) 来生成多样化且具有挑战性的推理问题及其参考答案，而无需额外的人工标注。

直接使用：https://go.hyper.ai/Mb6Cd

在这里插入图片描述

数据集构建示意图

5. AI-CUDA-Engineer-Archive 内核集合数据集

AI-CUDA-Engineer-Archive 数据集是一个由 AI 生成的 CUDA 内核集合，旨在促进开源模型的后续训练和开发更出色的 CUDA 功能模块。该数据集包含超过 3 万个 CUDA 内核，这些内核均由 AI 驱动的 CUDA 工程师生成，其中超过 1.7 万个内核已验证正确，约 50% 的内核性能优于 PyTorch 原生运行时间。

直接使用：https://go.hyper.ai/3lPrI

在这里插入图片描述

数据集示例

6. QM9 量子化学数据集

QM9 数据集该数据集是一个广泛使用的量子化学数据集，包含约 134k 个有机小分子的量子化学计算结果。这些分子由碳、氢、氮、氧和氟元素组成，且分子量不超过 900 道尔顿。

直接使用：https://go.hyper.ai/PZdz7

7. GEOM-Drugs 3D 分子构象数据集

GEOM-Drugs 数据集是一个大型的 3D 分子构象数据集，包含 43 万分子，每个分子平均有 44 个原子，经过数据处理后，每个分子最多可以包含 181 个原子。在实验中，研究者收集了每个分子对应的 30 个最低能量的构象，并要求每个基线方法生成这些分子的 3D 位置和组成原子的类型。

直接使用：https://go.hyper.ai/5B3U8

8. Fortune Telling 中文风水占卜数据集

数据集含 207 个关于风水、八字等问题，每个问题有唯一对应的答案。

直接使用：https://go.hyper.ai/31k1P

9.SuperGPQA 学科领域评估基准数据集

SuperGPQA 是一个用于评估高级问答系统性能的基准数据集，专注于自然语言处理和机器学习评估领域，旨在通过跨学科的复杂问题来测试模型的推理能力和知识水平。数据集涵盖了 285 个研究生级别的学科领域，问题类型多样，包括生物学、物理学、化学等多个科学领域。

直接使用：https://go.hyper.ai/oP1pb

10. olmOCR-mix-0225 大规模 PDF 文档数据集

olmOCR-mix-0225 是一个大规模、高质量的 PDF 文档数据集，专为训练和优化光学字符识别 (OCR) 模型而设计。数据集包含约 250k 页的 PDF 内容，涵盖学术论文、法律文件、手册等多种类型。数据集不仅包含文本内容，还提取了每页中显著元素（如文本块和图像）的坐标信息，这些信息被动态注入模型提示 (Prompt)，显著减少了模型的幻觉。

直接使用：https://go.hyper.ai/dXNkk

公共教程精选

1. 一键部署 QwQ-32B-AWQ

QwQ-32B 是 Qwen 系列的推理模型，相比传统指令调优模型，QwQ 具备思考和推理能力，在下游任务尤其是难题上能取得显著性能提升，能够媲美 DeepSeek-R1、o1-mini 等先进推理模型。

该项目相关模型和依赖已经部署完毕，启动容器后点击 API 地址即可进入 Web 界面。

在线运行：https://go.hyper.ai/Q8HmJ

在这里插入图片描述

Demo 示例

2. 使用 vLLM 部署 QwQ-32B

vLLM 是一款专为高效部署大语言模型设计的开源推理框架，其核心技术通过优化内存管理与计算效率，显著降低了模型推理的硬件门槛。本教程使用 vLLM 部署 QwQ-32B 模型进一步降低了部署成本，满足更多交互场景需求。

该项目相关模型和依赖已经部署完毕，启动容器后点击 API 地址即可进入 Web 界面。

在线运行：https://go.hyper.ai/8nPfC

在这里插入图片描述

Demo 示例

3.OpenManus + QwQ-32B 实现 Al Agent

OpenManus 是由 MetaGPT 团队推出的开源项目，旨在复刻 Manus 的核心功能，为用户提供无需邀请码、可本地化部署的智能体解决方案。

进入官网克隆并启动容器，进入工作空间，输入相应的指令即可体验模型。

在线运行：https://go.hyper.ai/GIX1H

在这里插入图片描述

模型生成的小游戏

4.Step-Audio-TTS-3B 产品级方言语音生成模型

Step-Audio 是由 Stepfun-AI 团队于 2025 年开源的业界首个集语音理解与生成控制一体化的产品级开源实时语音对话系统，支持多语言生成（如中文、英文、日语），语音情感（如开心、悲伤），方言（如粤语、四川话），可控制语速及韵律风格，支持 RAP 和哼唱等。

进入官网克隆并启动容器，直接复制 API 地址，即可进行多功能语音合成。

在线运行：https://go.hyper.ai/WiyVK

在这里插入图片描述

语音合成示例

社区文章精选

1. 准确率达 97%，澳大利亚团队新成果基于深度学习凭颅骨 CT 鉴定性别，赶超人类法医

澳大利亚西澳大学等团队，提出了使用基于深度学习的自动化框架，该研究利用印度尼西亚一家医院的 200 次颅骨 CT 扫描，训练并测试了 3 种基于深度学习的网络配置，其中最准确的深度学习框架能够将性别和颅骨特征结合在一起进行判断，分类准确率可达 97%，显著高于人类观察者的 82%。本文是该论文的详细解读和分享。

查看完整报道：https://go.hyper.ai/0rfjM

2. 以 1.7K 深圳小区房价为例，浙大 GIS 实验室使用注意力机制挖掘地理情景特征，提升空间非平稳回归精度

浙江省 GIS 重点实验室的研究人员提出了一种基于注意力机制的深度学习模型 CatGWR。该模型通过引入注意力机制，将样本之间的空间距离和情境相似性相结合，从而更准确地估计空间非平稳性。这为地理空间建模提供了新的视角，尤其是在处理复杂地理现象时，能够更好地捕捉空间异质性和情境影响。本文是该研究的详细解读和分享。

查看完整报道：https://go.hyper.ai/irDAo

3. 覆盖数学/代码/科学/谜题，高质量推理数据集汇总，助力复现 DeepSeek 超强推理能力

HyperAI超神经精心整理了当前热度较高的推理数据集，涵盖数学、代码、科学、谜题等多个领域。对于期望切实提升大模型推理能力的从业者与研究者而言，这些数据集无疑是绝佳的起点。本文是数据集下载地址。

查看完整报道：https://go.hyper.ai/XGIi8

4. 入选 ICLR 2025！浙大沈春华等人提出玻尔兹曼对齐技术，蛋白质结合自由能预测达 SOTA

浙江大学等提出了一种名为玻尔兹曼对齐的技术，将知识从预训练的逆折叠模型迁移到了结合自由能的预测，该方法表现出了优越的水平，收录于人工智能领域国际学术顶会 ICLR 2025。本文是该论文的详细解读和分享。

查看完整报道：https://go.hyper.ai/MsUDj

5. 模型参数超 RFdiffusion 5倍！英伟达等发布 Proteina，从头设计蛋白质主链性能达 SOTA

英伟达联合麻省理工学院等，开发出了一种新型的大规模流式蛋白质主链生成器 Proteina。Proteina 的参数量是 RFdiffusion 模型的 5 倍，并将训练数据扩展到 2,100 万个合成蛋白质结构，在从头设计蛋白质主链方面的性能达到了 SOTA 级别，并以前所未有的长度——高达 800 个残基，生成了多样化且可设计的蛋白质，成果已入选 ICLR 2025 Oral。本文是该研究的详细解读和分享。

查看完整报道：https://go.hyper.ai/n4fWv

6. 政府工作报告再提「人工智能+」，科技大佬两会提案聚焦 AI+ 医疗/AI 换脸拟声/大模型幻觉……

雷军、周鸿祎、刘庆峰等业界大佬紧扣时代脉搏，在新能源汽车、大模型幻觉、AI 医疗、AI 换脸、AI 教育等多个关键领域积极提案建言。更多详情见下文。

查看完整报道：https://go.hyper.ai/EazuY