- 博客(1563)
- 收藏
- 关注
原创 【持续更新中!图像-文本对数据集汇总】Stable Diffusion 3 重磅开源,超全图像生成必备训练数据集、教程汇总
Stability AI 已经正式开源 Stable Diffusion 3(简称 SD3)!SD3 是一个图像生成模型,只要给定一段描述性的文字,就能够创造出与之匹配的视觉作品。下图就是由 SD3 生成的图像。* prompt史诗级动漫作品:一位巫师在夜晚的山顶上向黑暗的天空施放宇宙咒语,咒语上写着「Stable Diffusion 3」,由五彩缤纷的能量组成在 SD3 的背后,是庞大的图像-文...
2024-06-13 11:00:53
4296
原创 【持续更新中!气象数据集汇总】气象局首次发布训练数据目录!CAMELS 美国天文气象数据集等上线官网
该数据集为论文 「Global prediction of extreme floods in ungauged watersheds」的研究数据,主要内容为 AI 模型生成的洪水重新分析 (1984-2021) 和重新预测 (2014-2021) 数据以及相应的 GloFAS 基准数据。数据集可鼓励在天气领域进行机器学习研究,方便在理解和减轻气候变化影响方面的工作。SEVIR 将多种天气传感模式组合并整合成一个单一的、可访问的数据集,该数据集可在云端免费访问,可供气象学家、数据科学家和其他研究人员使用。
2024-05-30 16:18:00
2286
原创 【持续更新中,图像分割数据集】字节发布 COCONut 入选 CVPR 2024,立即体验 Segment Anything 分割万物!|持续更新中!
随着计算机视觉技术的不断发展,图像分割在诸多领域展现出重要的应用价值。近年来,各种图像分割数据集如雨后春笋般涌现。上个月,字节跳动发布了首个大规模全景图像分割数据集「COCONut」,为这一领域的研究注入了新鲜血液。HyperAI超神经本周汇总了 10 个优质的图像分割数据集进行汇总和分析,以更好地推动相关研究的进展。除此之外,GitHub 上超火的项目「Segment Anything 分割万物...
2024-05-09 15:09:25
1363
1
原创 【持续更新中!数学数据集汇总】天才博士陶哲轩力荐数据集!含代码、中文竞赛题目、正向逆向问答对等
数学数据集持续更新中,建议收藏!欢迎投稿优质数据集
2024-04-23 20:19:00
2498
原创 首个天文多模态基础模型AION-1诞生!UC伯克利等基于2亿天文目标预训练,成功构建泛化性多模态天文AI框架
加州大学伯克利分校、剑桥大学、牛津大学等全球十余所科研机构的团队联合攻关,推出了首个面向天文学的大规模多模态基础模型家族——AION-1,通过统一的早期融合 backbone 网络,将图像、光谱和星表数据等异质观测信息进行集成建模,不仅在零样本场景下表现优异,其线性探测准确率也可媲美甚至超越针对特定任务专门训练的模型。
2025-11-24 14:09:21
584
原创 【TVM 教程】优化大语言模型
我们定义了一系列用于优化模型的传递过程(pass)。这个优化流程是专门为大语言模型(LLMs)设计的。):# 第一阶段:针对高层操作图的优化# 可以启用 cublas以进一步优化# 第二阶段:向 TIR(张量中间表示)下沉,继承 TVM Relax 的官方 "zero" 流程# 第三阶段:对 TIR 进行优化# 第四阶段:底层优化),# 第五阶段:转换为虚拟机字节码return mod。
2025-11-21 19:13:13
835
原创 从干洗店到伊丽莎白女王工程奖,李飞飞逆行硅谷技术神话,聚焦AI去人性化风险
2025 年春,李飞飞荣获「伊丽莎白女王工程奖」,以表彰其在计算机视觉与深度学习领域的奠基性贡献。作为 ImageNet 项目的核心推动者,她开创了数据驱动的视觉识别方法,也提出「以人为本」的 AI 理念,在硅谷的商业化浪潮中始终保持对 AI 伦理、社会价值与去人性化风险的警觉。然而,其少数派身份使她处于在科研成就与产业实践之间的微妙地带,引发持续讨论。
2025-11-21 14:56:43
1440
原创 从9,874篇文献到1.5万晶体结构,MOF-ChemUnity重构MOF全景知识,推动材料发现进入「可解释AI」时代
来自加拿大多伦多大学以及加拿大国家研究委员会清洁能源创新研究中心的研究团队提出 MOF-ChemUnity:一个结构化、可扩展、可拓展的知识图谱。该方法利用 LLM 在文献中 MOF 名称及其同指代与 CSD 中登记的晶体结构之间建立可靠的一一映射,从而实现 MOF 名称及其同义词与晶体结构的消歧。
2025-11-20 12:44:40
867
原创 图像地理定位新突破!缅因大学/谷歌/OpenAI等提出LocDiff框架,实现无需网格与参考库的全球级精准定位
缅因大学、谷歌公司与哈佛大学等组成的联合团队提出了「球面谐波狄拉克函数(SHDD)」及集成框架 LocDiff,通过构建适配球面几何的编码方式与扩散架构,实现了不依赖预设网格或外部图像库的精准定位,为该领域提供了突破性的技术路径。
2025-11-19 12:57:31
828
转载 HyperAI超神经 x CCF ODTC丨vLLM助力大模型推理性能革新
vLLM-MACA的适配与优化,不仅展示了开源社区在大模型推理方向的技术积累,也标志着国产GPU生态在AI基础软件层的又一次突破。面对大模型推理的「三高」困境(高延迟、高显存、高生态依赖),本次竞赛聚焦 GPU 底层算力革新与开源生态建设,HyperAI超神经是本次活动的官方合作社区,诚邀全球开发者共同攻坚。合作伙伴:ODTC AI Infra工作组、模力方舟、木兰开源社区、书生、上海开源信息技术协会、机智流、魔乐社区、飞桨、上海源庐加佳信息科技有限公司、龙蜥社区、HyperAI超神经。
2025-11-19 11:04:50
35
原创 在线教程丨目标检测迈入「全局感知」时代:清华大学等发布 YOLOv13,实现速度、精度双突破
「一键部署 Yolov13」已上线至 HyperAI超神经官网的「教程」板块,仅需上传图片,即可立刻得到精准的目标识别反馈,快来试试吧~
2025-11-18 13:26:18
629
原创 跨学科创新远超人类?AI科学家提假设/做实验/发顶会开启科学研究新范式
2024 年 8 月,Transformer 论文作者之一 Llion Jones 创立的 Sakana AI 推出全球首位「AI 科学家」,可自主提出研究问题、设计实验并撰写论文,引发全球科研界震动。从自动化实验到自主发现,AI 正从科研助手跃升为「共同研究者」。当 AI 走进实验室,科学的未来将被如何改写?
2025-11-17 14:04:11
927
原创 AI 论文周报丨大规模预训练模型/通用游戏Agent/注意力架构/上下文工程……一文速览学术热门成果
基于现实挑战,字节跳动 Seed 团队提出了了一种用于预训练通用游戏 Agent 的新框架 Game-TARS ,其核心贡献在于范式上的根本性转变:不再依赖特定应用的高级动作指令,而是直接定义一个与低级计算机输入设备(如键盘和鼠标)紧密关联的可扩展、统一动作空间。本文旨在定位语境工程的学术坐标,提供系统性的定义,梳理其历史与概念图景,并探讨实践中的关键设计考量,为语境工程构建一个概念基础,并勾勒其广阔的发展前景。本文提出 Game-TARS,这是一种基于统一且可扩展的动作空间的通用游戏。
2025-11-15 11:00:33
721
原创 合成生物学之父/OpenAI前高管/Flagship合伙人联手,Lila Sciences估值达13亿美元,目标推进「科学超级智能」
位于马萨诸塞州剑桥的初创公司 Lila Sciences 宣布完成新一轮融资,其 A 轮融资总额达到 3.5 亿美元,总融资额达到 5.5 亿美元。这笔资金的注入,直接将 Lila 推过了 13 亿美元估值的门槛,使其正式跻身独角兽之列。
2025-11-14 11:48:43
601
原创 合成生物学之父/OpenAI前高管/Flagship合伙人掌舵Lila Sciences估值13亿美元,目标推进「科学超级智能」
他将 Lila 的使命概括为构建一个横跨材料、化学、生命等科学领域的「美丽心灵(beautiful mind)」,并进一步指出:「我们无需再将科学割裂为无数细分领域,而是可以构建一个能够跨越众多科学领域的统一智能体,使其融会贯通关于世界运行方式的知识。在 2023 年,Flagship 内部的两个研究项目——一个专注于新材料研究,另一个聚焦于生物学应用,他们逐渐发现两个团队招募的人才以及试图解决的问题都不谋而合,因此决定强强联手,孕育了出今天的 Lila Sciences。
2025-11-14 11:07:41
729
转载 HyperAI超神经 x CCF ODTC丨TileLang助力国产GPU算子优化
本项目通过「语言工具+国产硬件+在线平台」的组合,打破国产 GPU 生态「硬件强、软件弱」的僵局,为开发者提供「开箱即用」的国产 GPU 开发方案,推动中国算力产业从「单点突破」转向「生态共荣」,助力智算、通用计算领域的国产化替代与创新发展。MACA AI 编译器团队和 TileLang 社区合作已提前参与该项目,探讨 MACA GPU 与 TileLang 的适配(开源仓库:mcTileLang),通过 MXMACA 软件栈实现深度协同,核心算子性能接近国际主流产品。
2025-11-14 11:07:41
23
原创 NeurIPS2025丨MIT提出自动化科学发现工具,AutoSciDACT对天文/物理/生物医学等异常数据强敏感
麻省理工学院、威斯康星大学麦迪逊分校等团队,提出一种名为 AutoSciDACT 的方法,可用于自动化检测科学数据中的「新发现」,从而简化科学探究。
2025-11-13 11:42:52
947
原创 【Triton 教程】triton_language.trans
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。未被指定,该函数默认为 (1,0) 置换,有效地转置了 1 个二维张量。和这个函数是等价的,但它不包含当没有指定置换时的特殊处理情况。更多 Triton 中文文档可访问 →。的成员函数调用,使用。
2025-11-12 16:55:27
166
原创 Stability AI正式启动商业化转型:开源繁荣但盈利危机,高层换血/产品重构能否自救
开源先锋 Stability AI 在经历爆发式增长与盈利困境后,正式启动企业化转型。2025 年推出企业级产品「Stability AI Solutions」,标志其从开源理想主义走向商业现实。随着融资危机、管理层更迭与市场份额下滑,Stability AI 的转型折射出开源 AI 在可持续性、治理与商业化之间的结构性矛盾,也揭示了技术民主化理念在资本逻辑下的重构与再平衡。
2025-11-12 12:01:26
686
原创 在线教程丨Deepseek-OCR以极少视觉token数在端到端模型中实现SOTA
Deepseek-OCR 利用视觉模态作为文本信息的有效压缩媒介,从而实现了远高于传统文本表示的压缩比。「DeepSeek-OCR:「视觉压缩」替代传统字符识别」现已上线 HyperAI超神经官网(hyper.ai)的「教程」板块,快来一键部署体验!
2025-11-11 12:37:18
660
原创 哥大/斯坦福联手!Squidiff实现多场景转录组模拟,助力精准医学与空间医学发展
哥伦比亚大学、斯坦福大学的联合研究团队,开发了 Squidiff 计算框架。该框架基于条件去噪扩散隐式模型构建,可预测不同细胞类型在分化诱导、基因扰动及药物处理下的转录组响应。研究团队进一步将 Squidiff 应用于血管类器官研究,成功预测了辐射暴露对各类细胞的影响效应,并评估了辐射防护药物的保护效能。
2025-11-10 14:08:20
647
原创 实时目标检测SOTA!YOLOv13拓展全局感知能力;入选NeurIPS 2025,UltraHR-100K解锁超高分辨率文生图
HyperAI 超神经为大家整理了 10.20-10.24 期间一系列极具价值且应用广泛的教程和数据集,涵盖生物医学、 HPC 、数学推理、文本信息抽取等多个领域~
2025-11-10 14:08:17
1324
原创 【vLLM 学习】使用 OpenAI 批处理文件格式进行离线推理
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →源码本指南介绍如何使用 OpenAI 批处理文件格式执行批量推理,完整的 Batch (REST) API。
2025-11-07 19:14:33
1038
原创 中国科大创建乾坤网络精确求解多电子薛定谔方程
中国科学技术大学精准智能化学重点实验室商红慧特任教授、杨金龙院士团队将人工智能领域的 Transformer 架构与量子物理的基本方程相结合,发展了一种求解多电子薛定谔方程的乾坤网络(QiankunNet),显著加速了变分优化的收敛过程。
2025-11-07 15:32:51
270
原创 解决蛋白质构象异质性的原子级建模挑战!David Baker团队PLACER框架解析
来自华盛顿大学 David Baker 教授的研究团队开发了一种图神经网络 PLACER,能够基于小分子的原子组成与键合信息,精确生成多种有机小分子的结构;并在给定蛋白质宏观结构环境的情况下,为蛋白–小分子对接任务构建小分子与蛋白质侧链的详细结构。
2025-11-07 15:31:52
917
原创 服务OpenAI/Meta/谷歌等,3名22岁辍学生颠覆AI招聘赛道,成立2年的Mercor估值达百亿
Mercor 由 3 位年仅 22 岁的大学辍学生创办,仅用不到 3 年时间完成 3.5 亿美元 C 轮融资,估值飙升至 100 亿美元。公司通过 AI 招聘模式,将传统招聘效率缩至秒级,并推出 APEX 评测,为 AI 经济价值评估提供全新标准。
2025-11-06 13:02:59
986
原创 超越传统4200倍速!苏黎世联邦理工提出NOBLE,首个经人类皮层数据验证的神经元建模框架
苏黎世联邦理工学院、加州理工学院与阿尔伯塔大学等机构的联合团队提出了一种名为 NOBLE 的深度学习框架。它是首个通过人类大脑皮层实验数据来验证其性能的规模化深度学习框架,首次实现了直接从实验数据中学习神经元的非线性动力学行为,其模拟速度比传统数值求解器快出 4200 倍。
2025-11-05 13:49:31
848
原创 在线教程丨端侧TTS新SOTA!NeuTTS-Air基于0.5B模型实现3秒音频克隆
进入 Demo 运行页面后,在「Reference Audio」上传参考音频,在「Reference Text」文本框中输入参考文本,将克隆后希望得到的音频文本内容输入「Text to Generate」,点击「Submit」后稍等片刻即可得到克隆音频。NeuTTS-Air 的发布,正值行业对高效、低延迟、高逼真度 TTS 需求激增之际,尤其是在端侧部署(On-Device)和即时语音克隆领域,它降低了开发者在移动和边缘设备上部署高质量 TTS 的门槛,让「超现实」的声音不再是云端大模型的专属。
2025-11-04 17:02:47
584
原创 Demis Hassabis带领DeepMind告别纯科研时代:当AI4S成为新叙事,伦理考验仍在继续
我首先将自己定位为一名科学家,我一生所做的一切,都是为了追求知识,并试图理解我们周围的世界」,Demis Hassabis 认为,AI 的真正潜力不在于模仿人类,而在于扩展人类的认知边界,AI 在生命科学、材料设计、气候建模和能源优化等领域的长期价值,远超生成式 AI 带来的短期商业红利。「诺贝尔基金会似乎急于将 AI 的进步,以及计算可解的科学理念,视为该至高奖项的有力竞争者,但这种认可也存在着风险,它可能掩盖人们对这项技术本身以及 AI 技术日益集中于在少数几家公司手中的担忧。
2025-11-03 19:17:11
1033
原创 【Triton 教程】triton_language.split
它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。如果希望拆分成多个部分,可以多次调用这个函数(可能还需要调用 reshape 函数)。这反映了 Triton 中的约束,即张量必须具有 2 的幂次方大小。例如,给定 1 个形状为 (4,8,2) 的张量,生成 2 个形状为 (4,8) 的张量。给定 1 个形状为 (2) 的张量,返回 2 个标量。将张量沿着其最后 1 个维度分成 2 部分,该维度的大小必须为 2。
2025-10-31 19:30:26
167
原创 OpenAI前副总裁携DeepMind科学家创业:20余精英科学家+3亿美元押注「AI做科学」
有行业分析师推测,这或许源于技术路线的根本分歧:OpenAI 聚焦通用人工智能,而 Periodic Labs 的 「AI for Science」 垂直路线,更接近谷歌 DeepMind 的战略方向。这场资本盛宴的序曲充满戏剧性。7 个月前,Fedus 和 Cubuk 在旧金山的一次对话中探讨生成式人工智能如何重塑科学发现的过程,两人都在不同的实验室中见证了 AI 的力量,却也同时感受到它的边界。几周后,两人正式离开各自的公司,召集了一批志同道合的科学家,创立了一个以 AI 驱动实验科学的研究公司。
2025-10-31 18:54:26
1069
原创 效率至高提升20倍!加州大学开发OmniCast,解决自回归天气预报模型误差累计问题
为确保 OmniCast 在训练和评估方面得到充分、合理的支持,研究采用了目前被气象领域广泛应用的高分辨率再分析数据集 ERA5 作为基础数据来源,并针对中期天气预报(Medium-range Weather Forecasting)和 S2S 天气预报两个不同的预报任务进行了数据预处理,以作为基准测试集适配不同的任务要求。总而言之,困扰 S2S 天气预报的问题正随着技术的迭代而减少,未来,随着人工智能和深度学习等技术与气象领域的融合加深,势必将会彻底打破「天有不测风云」的传统认知。
2025-10-30 17:54:28
816
原创 【TVM 教程】自定义优化
TVM 先已更新到 0.21.0 版本,TVM 中文文档已经和新版本对齐。Apache TVM 是一个深度的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →Apache TVM 的一个主要设计目标是便于自定义优化流程,无论是用于科研探索还是工程开发,都可以灵活迭代优化过程。
2025-10-29 22:35:15
366
原创 黄仁勋最新演讲:10亿美元投资诺基亚,Rubin明年量产,AI工厂推进落地……
同时发布 Omniverse DSX 数字孪生平台,用于设计并运营 100 兆瓦至千兆瓦级 AI 工厂,每年可带来数十亿美元的额外收入,已在弗吉尼亚州马纳萨斯的 AI 工厂研究中心得到验证,帮助全球合作伙伴打造人工智能基础设施。使用越多,就需要更多算力;3 月的 GTC 上,黄仁勋曾笑称 GTC 是 「AI 行业的超级碗」。总结来看,在这场信息含量极高、技术更新密集的主旨演讲中,从大规模 GPU 部署和量子突破,到人工智能工厂、机器人技术,黄仁勋从多角度分享了英伟达在 AI 基础设施建设上的能力与价值。
2025-10-29 13:14:13
1140
原创 准确率达91%!Reac-Discovery融合数学建模/机器学习/自动化实验,解决自驱动实验室系统通用性难题
自驱动实验室系统提高了化学反应器设计的速度和精度,但现有研究缺乏针对几何参数的统一模型。针对不同体系间的通用性问题,来自西班牙 IMDEA 材料研究所的研究团队推出了 Reac-Discovery 半自主数字平台,基于周期性开孔结构,推出了先进催化反应器的创新解决方案。
2025-10-28 12:56:28
985
原创 MIT团队开源BoltzGen,可跨分子类型设计蛋白结合物,66%靶标获纳摩尔级亲和力
麻省理工学院与Boltz等机构合作开发了全原子生成模型BoltzGen,统一了结构预测与结合体设计。该模型采用几何连续表示和扩散模块,实现了蛋白折叠、结合位点建模与序列生成的原子级精度同步优化。实验显示,BoltzGen设计的纳米抗体和蛋白结合体在66%的靶标上达到纳摩尔级亲和力,并成功应用于多肽、小分子等多种生物分子设计。研究通过跨模态训练策略和灵活的设计规范语言,解决了传统方法计算成本高、通用性有限的问题,为AI驱动的药物研发提供了高效可控的新工具。相关成果已开源,代码发布于GitHub。
2025-10-27 14:44:26
745
原创 谷歌多团队联手打造 Earth AI,聚焦3大核心数据,地理空间推理能力提升 64%
Google 多个团队联合提出 「Earth AI」 地理空间人工智能模型与智能推理系统,构建可互操作的 GeoAI 模型家族,并通过定制化推理 Agent 实现多模态数据的协同分析。该系统聚焦影像、人口、环境三大核心数据类型,借助 Gemini 驱动的 Agent 串联三类模型,突破了单点模型的局限,使非专业用户也能执行跨领域实时分析,推动地球系统研究迈向可行动的全局洞察。
2025-10-24 14:58:57
661
原创 明日开播!从前沿动态到实战经验,vLLM 推理优化实战 Meetup 定档 10 月 25 日
10 月 25 日,vLLM 推理优化实战 Meetup 将在上海浦东模力社区展开,作为官方合作社区,HyperAI超神经将通过视频号为大家带来本次 Meetup 的直播,无法到场的小伙伴快来预约观看直播吧~
2025-10-24 14:58:18
338
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅