自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

HyperAI超神经

人工智能领域实验媒体,站在技术与人文的路口,读懂人工智能。

  • 博客(1634)
  • 收藏
  • 关注

原创 【持续更新中!图像-文本对数据集汇总】Stable Diffusion 3 重磅开源,超全图像生成必备训练数据集、教程汇总

Stability AI 已经正式开源 Stable Diffusion 3(简称 SD3)!SD3 是一个图像生成模型,只要给定一段描述性的文字,就能够创造出与之匹配的视觉作品。下图就是由 SD3 生成的图像。* prompt史诗级动漫作品:一位巫师在夜晚的山顶上向黑暗的天空施放宇宙咒语,咒语上写着「Stable Diffusion 3」,由五彩缤纷的能量组成在 SD3 的背后,是庞大的图像-文...

2024-06-13 11:00:53 4501

原创 【持续更新中!气象数据集汇总】气象局首次发布训练数据目录!CAMELS 美国天文气象数据集等上线官网

该数据集为论文 「Global prediction of extreme floods in ungauged watersheds」的研究数据,主要内容为 AI 模型生成的洪水重新分析 (1984-2021) 和重新预测 (2014-2021) 数据以及相应的 GloFAS 基准数据。数据集可鼓励在天气领域进行机器学习研究,方便在理解和减轻气候变化影响方面的工作。SEVIR 将多种天气传感模式组合并整合成一个单一的、可访问的数据集,该数据集可在云端免费访问,可供气象学家、数据科学家和其他研究人员使用。

2024-05-30 16:18:00 2389

原创 【持续更新中,图像分割数据集】字节发布 COCONut 入选 CVPR 2024,立即体验 Segment Anything 分割万物!|持续更新中!

随着计算机视觉技术的不断发展,图像分割在诸多领域展现出重要的应用价值。近年来,各种图像分割数据集如雨后春笋般涌现。上个月,字节跳动发布了首个大规模全景图像分割数据集「COCONut」,为这一领域的研究注入了新鲜血液。HyperAI超神经本周汇总了 10 个优质的图像分割数据集进行汇总和分析,以更好地推动相关研究的进展。除此之外,GitHub 上超火的项目「Segment Anything 分割万物...

2024-05-09 15:09:25 1414 1

原创 【持续更新中!数学数据集汇总】天才博士陶哲轩力荐数据集!含代码、中文竞赛题目、正向逆向问答对等

数学数据集持续更新中,建议收藏!欢迎投稿优质数据集

2024-04-23 20:19:00 2671

原创 完整回放|上海创智/TileAI/华为/先进编译实验室/AI9Stars深度拆解 AI 编译器技术实践

学院坚持「以学生为中心、以前沿为牵引」的培养理念,通过超高规格的师资、超常措施的培养、超凡条件的保障,探索具有中国特色的 AI 领军人才培养方案,致力于培养中国 AI 领军人才,打造世界人工智能创新高地。2022 年 11 月,在 MLC.AI 社区志愿者的共同努力下,首个完整的 TVM 中文文档上线,并成功托管至 HyperAI超神经官网,进一步为对机器学习编译感兴趣的国内开发者,提供了接触并学习一门新技术的基础设置——文档。进的 AI 编译器技术浪潮中,越来越多的探索正在发生、沉淀与交汇。

2026-01-08 19:46:12 447

原创 【vLLM 学习】Rlhf

vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。

2026-01-07 15:42:44 113

原创 贝佐斯/比尔盖茨/英伟达/英特尔等押注,NASA工程师带队打造通用机器人大脑,公司估值达20亿美元

成立于 2023 年的具身智能公司 FieldAI ,在不到两年时间内完成了超过 4.05 亿美元融资,投资阵容包括:贝佐斯、英特尔、英伟达、比尔盖茨、三星等。团队核心成员来自 NASA JPL、DeepMind、特斯拉、SpaceX 等头部企业,致力于打造能够跨不同类型机器人和适配各种环境的「通用机器人智能大脑」。

2026-01-07 15:40:09 575

原创 黄仁勋最新演讲:5项创新加持,Rubin性能数据首曝;多样化开源,覆盖Agent/机器人/自动驾驶/AI4S

当拉斯维加斯的聚光灯再度投向 AI、指向底层硬件支撑,无论是黄仁勋侃侃而谈的 Rubin 平台,亦或是苏姿丰将于今晚揭晓的重磅新品,都不仅仅是在发布一代芯片或一次性能跃迁,更像是在为下一阶段的 AI 发展划定边界:算力如何被组织、成本如何被压缩、模型如何真正走向推理、Agent 与现实世界如何深度耦合。CES 2026 所呈现的,已不只是厂商之间的规格对决,而是一场围绕 AI 基础设施形态的集体选择。可以确定的是,竞争的重心,正在从模型本身,转向谁能更高效、更稳定地承载智能的规模化落地。参考资料。

2026-01-06 21:11:19 933

原创 交互式世界建模新方案!腾讯混元发布世界模型WorldPlay,兼顾实时生成与长期几何一致性;5万条样本!Med-Banana-50K支持增删病灶双向编辑

世界模型正驱动计算智能领域的重心逐渐从语言任务拓展至视觉与空间推理,通过构建动态三维环境的模拟能力,这些模型使智能体得以感知并与复杂场景交互,从而为具身智能、游戏开发等领域开启了新的研究与应用前景。该方法通过对齐教师模型与学生模型之间的记忆上下文,使学生模型在保持实时推理速度的同时,不丧失利用远程信息的能力,有效抑制误差偏移。为保障长期一致性,该模型设计了一种动态重构上下文记忆模块,能够重建历史帧的上下文信息,并通过时间重构策略,保持几何关键但时间久远的帧仍可被访问,从而显著缓解记忆衰减问题。

2026-01-06 21:04:18 432

原创 【Triton 教程】triton.language.advance

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。

2026-01-06 12:32:23 140

原创 【TVM教程】TVM 运行时系统

TVM 现已更新到 0.21.0 版本,TVM 中文文档已经和新版本对齐。Apache TVM 是一个深度的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →Apache TVM

2026-01-05 21:34:22 910

原创 生成1.8万年气候数据,英伟达等提出长距离蒸馏,仅需单步计算实现长期天气预报

英伟达研究院联合华盛顿大学的研究团队推出了一种长距离蒸馏方法,其核心思路是利用擅长生成真实大气变率的自回归模型作为「教师」,再用这些数据训练一个概率化的「学生」模型,仅需单步计算即可生成长期预报,既避免了迭代误差累积,也绕过了复杂的数据校准难题。

2026-01-05 20:31:02 1028

原创 交互式世界建模新方案!腾讯混元发布世界模型WorldPlay,兼顾实时生成与长期几何一致性;5万条样本!Med-Banana-50K支持增删病灶双向编辑

世界模型正驱动计算智能领域的重心逐渐从语言任务拓展至视觉与空间推理,通过构建动态三维环境的模拟能力,这些模型使智能体得以感知并与复杂场景交互,从而为具身智能、游戏开发等领域开启了新的研究与应用前景。该方法通过对齐教师模型与学生模型之间的记忆上下文,使学生模型在保持实时推理速度的同时,不丧失利用远程信息的能力,有效抑制误差偏移。为保障长期一致性,该模型设计了一种动态重构上下文记忆模块,能够重建历史帧的上下文信息,并通过时间重构策略,保持几何关键但时间久远的帧仍可被访问,从而显著缓解记忆衰减问题。

2026-01-05 11:06:38 569

原创 仅需5秒一步实现克隆!Chatterbox-Turbo 实现高采样率无损音质的语音生成

近期,Resemble AI 发布高性能对话式文本转语音(TTS)模型 Chatterbox-Turbo,这是首个开源的情绪程度控制模型。

2026-01-03 11:01:56 925

原创 在线教程丨 David Baker 团队开源 RFdiffusion3,实现全原子蛋白质设计的生成式突破

「RFdiffusion3:蛋白质设计模型」现已上线 HyperAI超神经官网(hyper.ai)的「教程」板块,快来一键部署体验!

2025-12-31 16:31:43 815

原创 在线教程丨David Baker团队开源RFdiffusion3,实现全原子蛋白质设计的生成式突破

目前包括 RFdiffusion(RFD1)和 BindCraft 在内的大多数方法,均采用氨基酸残基水平的蛋白质表示,已能够成功设计蛋白质单体、组装体以及蛋白质-蛋白质相互作用体系,但其分辨率仍不足以精确设计与非蛋白质组分(如小分子配体与核酸)发生特异性侧链相互作用的结构。研究团队通过设计并实验表征 DNA 结合蛋白与半胱氨酸水解酶,展示了 RFD3 的广泛适用性,其能够基于任意非蛋白质原子环境快速生成受复杂原子级约束引导的蛋白质结构,将进一步拓展蛋白质设计所能实现的功能范围。

2025-12-31 11:01:06 730

原创 「地质约束显式+数据驱动模型」的新路径,浙江大学团队实现跨区域矿产远景预测性能和可解释性提升

浙江大学的研究团队提出了一种地质约束的数据驱动成矿预测方法,通过将各向异性空间邻近关系与空间非平稳建模机制显式引入预测框架,实现对成矿异质性与方向性控制的定量表达。

2025-12-30 16:42:52 951

原创 【vLLM 学习】Reproduciblity

源码 examples/offline_inference/reproduciblity.py。推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →vllm.hyper.ai/

2025-12-30 16:28:57 224

原创 【Triton 教程】triton_language.make_block_ptr

它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。更多 Triton 中文文档可访问 →triton.hyper.ai/返回指向父张量中 1 个块的指针。

2025-12-30 16:22:59 155

原创 【TVM教程】设计与架构

IRModule:包含 relay.Function 和 tir.PrimFuncruntime.Module:包含 runtime.PackedFunc编译基本是在进行关键数据结构之间的转换。relay/transform 和 tir/transform 是确定性的基于规则的转换meta-schedule 则包含基于搜索的转换最后,编译流程示例只是 TVM 堆栈的一个典型用例。将这些关键数据结构和转换提供给 Python 和 C++ API。

2025-12-29 18:35:19 1088

原创 【vLLM 学习】Profiling

vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →。

2025-12-26 18:48:21 196

原创 【Triton 教程】triton_language.store

它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。triton.PointerType, 或 dtype=triton.PointerType 的块。应为 {“”, “evict_first”, “evict_last”} 中的一个。是 1 个 N 维指针张量,则会存储 1 个 N 维张量。定义的块指针,则会存储 1 个张量。是单元素指针,则加载 1 个标量。将数据张量存储到由指针定义的内存位置。triton.int1 的块。

2025-12-26 18:43:52 247

原创 【TVM 教程】处理 TVM 错误

​恭喜!你找到了这篇文档。下面是一些关于如何理解这些错误信息以及遇到错误时可以采取哪些措施的提示。

2025-12-26 18:38:42 416

原创 在线教程|精准图像分层,Qwen-Image-Layered突破目标图层编辑痛点,兼顾高保真与一致性

「Qwen Image Layered Interface 自动拆分多个图层」已上线至 HyperAI超神经官网(hyper.ai)的教程板块,一键部署即可在线体验图像分层编辑。

2025-12-26 16:19:59 797

原创 在线教程|精准图像分层,Qwen-Image-Layered突破目标图层编辑痛点,兼顾高保真与一致性

3.选择「NVIDIA GeForce RTX 5090-2」以及「PyTorch」镜像,按照需求选择「Pay As You Go(按量付费)」或「Daily Plan/Weekly Plan/Monthly Plan(包日/周/月」,点击「Continue job execution(继续执行)」。多数模型本质上仍以整图像素生成与重绘为核心,前景、背景、光影在隐空间中高度耦合,所谓「分层编辑」更多只是基于遮罩的局部重生成,并不具备可持续存在的对象与图层概念,亟需引入结构感知和对象级的图层建模能力。

2025-12-25 20:01:41 855

原创 计算成本减半,化学反应发现工具ChemOntology将人类直觉「编码」到系统中,加速反应路径搜索

日本北海道大学开发的 ChemOntology 框架,实现了化学本体论从「描述性标注」到「指导性控制」的跨越。该框架在经典 Heck 反应机理研究中的成功应用,不仅验证了其加速路径搜索的有效性,也凸显出「化学知识」与「自动化计算」相融合的巨大潜力。

2025-12-24 14:43:38 627

原创 入选NeurIPS 2025,智源/北大/北邮提出多流控制视频生成框架,基于音频解混实现精确音画同步

音频驱动视频生成的现有方法,往往面临音频整体性带来的处理限制,使音频与视觉之间的对应关系趋于模糊。对此,北京智源人工智能研究院、北京大学、北京邮电大学共同提出了一种基于解混音频的音画同步视频生成框架,将输入音频拆分为语音、音效和音乐三类音轨,验证了音频解混与多流控制在复杂视频生成任务中的有效性。

2025-12-23 14:30:59 800

原创 三维视觉新突破:字节Seed推出DA3,实现任意视角重建视觉空间;7w+真实工业环境数据!CHIP 填补 6D姿态估计工业数据空白

HyperAI 超神经为大家整理了 12.15-12.19 期间一系列极具价值且应用广泛的教程和数据集,涵盖 3D 视觉、具身智能、OCR 等多个领域~

2025-12-23 14:09:54 674

原创 在线教程丨基于AI手势识别,仅用CPU即可定制形态多变的3D圣诞树

「基于手势识别的 3D 圣诞树」已上线 HyperAI超神经官网(hyper.ai)的教程板块,随着圣诞节脚步临近,快来生成专属圣诞树吧!

2025-12-23 14:03:14 754

原创 在线教程丨基于AI手势识别,仅用CPU即可定制形态多变的3D圣诞树

如果放入了更多照片(例如从默认的 31 张增加到 100 张),需要打开文件:dependencies.sh,将看到:export VITE_TOTAL_PHOTOS=31,修改数字「31」为实际图片数量,然后关闭容器再次启动即可。装饰圣诞树几乎成了每个家庭迎接节日时不可或缺的一环,彩灯一圈圈绕上树枝,挂件、照片慢慢填满空隙,灯亮起的那一刻,节日的氛围也随之到位。更有意思的是,这不仅是一棵普通的圣诞树,通过上传个性化、有意义的图片,用户还能将其装扮为一个充满回忆的交互式艺术画廊。

2025-12-22 20:54:37 576

原创 三维视觉新突破:字节Seed推出DA3,实现任意视角重建视觉空间;7w+真实工业环境数据!CHIP填补6D姿态估计工业数据空白

从视觉输入中感知和理解三维空间信息的能力,是空间智能的基石,也是机器人与混合现实(Mixed Reality,ML)等应用的关键需求。Depth-Anything-3(DA3)是由 ByteDance-Seed 团队发布的突破性视觉几何模型,以「极简建模」理念革新视觉几何任务:仅采用单一普通 Transformer(如 vanilla DINO 编码器)作为骨干网络,通过「深度射线表示」替代复杂多任务学习,即可从任意视觉输入(已知/未知相机姿态均可)中预测空间一致的几何结构。

2025-12-22 20:54:37 660

原创 AI 论文周报丨英伟达开源模型/OpenAI基准测试/Agent系统/长上下文推理……AI 动态一文速递

12.8-12.12 AI 论文推荐

2025-12-19 13:08:08 835

原创 预测精度可提升60%,清华李勇团队提出神经符号回归方法,自动推导高精度网络动力学公式

清华大学电子工程系李勇教授及团队提出了一种神经符号回归方法 ND²,通过从数据中自动推导出数学公式来刻画系统动力学。该方法将高维网络上的搜索问题等价地简化为一维系统,并利用预训练神经网络引导高精度的公式发现。

2025-12-19 12:47:53 767

原创 GPT-5全面领先,OpenAI发布FrontierScience,「推理+科研」双轨检验大模型能力

2025 年 12 月 16 日,OpenAI 推出了旨在衡量专家级科学能力的基准测试 FrontierScience,并以「FrontierScience:evaluating AI’s ability to perform expert-level scientific tasks」为题发布论文成果。根据初步评估,GPT-5.2 在 FrontierScience-Olympiad 和 Research 任务中分别得分 25% 和 77%,领先于其他前沿模型。

2025-12-18 15:08:42 1046

原创 坚持提前监管,离开OpenAI后,Dario Amodei将AI安全写入公司使命

在全球 AI 竞速按下「加速键」的当下,Dario Amodei 却以「提前监管」的少数派立场成为硅谷最不可忽视的力量。从推动 Constitutional AI,到影响欧美监管框架,他试图为 AI 时代奠定一套类似 TCP/IP 的「治理协议」。这不仅关乎安全,更关乎未来十年 AI 能否从技术狂飙走向稳定应用。Amodei 的策略,正在重塑全球 AI 产业的底层逻辑。

2025-12-18 14:51:56 858

原创 【vLLM 学习】vLLM TPU 分析

vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →源码此脚本用于分析 vLLM 在特定预填充(prefill)或解码(decode)令牌形状下的 TPU 性能表现。注意:实际运行的服务器会混合处理多种形状的预填充和解码请求。假设您已在使用 TPU 环境(本测试基于 TPU v6e)并已按照完成 vLLM 安装。

2025-12-17 17:21:56 459

原创 【Triton 教程】triton_language.load

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。是 1 个 N 维指针张量,则加载 1 个 N 维张量。或 dtype=triton.PointerType 的块。是单元素指针,则加载 1 个标量。定义的块指针,则加载 1 个张量。应为 {“”, “ca”, “cg”} 中的一个。更多 Triton 中文文档可访问 →。triton.int1 的块。

2025-12-17 17:17:52 449

原创 【TVM 教程】设置 RPC 系统

​远程过程调用(RPC)是 Apache TVM 中非常重要和有用的功能,它允许我们在真实硬件上运行已编译好的神经网络(NN)模型,无需手动操作远程设备,输出结果会通过网络自动返回。通过省去一些人工操作,比如将输入数据转储到文件、将导出的神经网络模型拷贝到远程设备、设置设备用户环境、将输出结果拷贝回主机开发环境,RPC 极大地提升了开发效率。此外,由于只有已编译神经网络模型的执行部分运行在远程设备上,所有其他部分都运行在主机开发环境中,因此可以使用任何 Python 包来完成预处理和后处理工作。

2025-12-17 17:14:45 408

原创 【vLLM 学习】Prithvi Geospatial Mae

vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →。

2025-12-17 17:10:29 371

原创 【Triton 教程】triton_language.dot

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。这 2 个块必须都是二维或三维的并且有兼容的内部维度。对于三维的块,tl.dot 执行批量矩阵乘积,其中每个块的第一维度代表批量维度。更多 Triton 中文文档可访问 →。返回 2 个块的矩阵乘积。

2025-12-17 17:06:49 270

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除