- 博客(349)
- 收藏
- 关注
原创 一文看懂AI算力类型,开启你的AI学习之旅!
在人工智能的世界里,算力,看似无形,却拥有着改变一切的强大力量。对于刚踏入AI领域的初学者来说,理解算力如何支撑AI训练等过程,以及不同类型算力的区别,是开启AI学习大门的关键一步。简单来说,算力就是计算机进行数据处理和运算的能力。在AI训练中,我们会给模型输入大量的数据,就像给一个超级“学生”提供海量的学习资料。而这个“学生”要从这些资料里总结出规律,学会如何完成各种任务,比如图像识别、语言翻译等。这个学习过程,也就是训练,需要进行巨量的计算。
2025-06-18 17:41:36
422
原创 谷歌性价比之王 Gemini 2.5 Flash-Lite发布:最快轻量版AI模型!
谷歌AI家族迎来最具性价比成员:不仅能实时生成操作系统界面,还是最快、成本最低的型号。
2025-06-18 17:07:15
334
原创 开源新王诞生!MiniMax-M1正式发布,超强上下文能力剑指DeepSeek!
一百万token上下文窗口,八倍于DeepSeek R1的处理长度,训练成本仅53万美元——沉寂已久的AI六小虎之一MiniMax用开源新模型重新定义了性价比。
2025-06-17 16:25:17
343
原创 Qwen3-Embedding-Reranker本地部署教程:8B 参数登顶 MTEB 多语言榜首,100 + 语言跨模态检索无压力!
Qwen3-Embedding与Qwen3-Reranker是阿里巴巴通义实验室于今年6月开源的双模型系列,专为文本表征、检索与排序任务设计。基于Qwen3基础模型构建,二者通过协同工作显著提升语义理解与信息检索效率,在多语言场景和工业部署中表现卓越。基于 Qwen3 系列的密集基础模型,提供了各种大小(0.6B、4B 和 8B)的全面文本嵌入和重新排序模型。该系列继承了其基础模型出色的多语言能力、长文本理解和推理技能。
2025-06-16 19:25:21
489
原创 告别复杂文档解析噩梦!MonkeyOCR 本地部署教程:支持公式/表格多元素结构化
MonkeyOCR 是华中科技大学联合金山办公(Kingsoft Office)推出的文档解析模型,模型支持高效地将非结构化文档内容转换为结构化信息。基于精确的布局分析、内容识别和逻辑排序,显著提升文档解析的准确性和效率。与传统方法相比,MonkeyOCR在处理复杂文档(如包含公式和表格的文档)时表现出色,平为性能提升5.1%,在公式和表格解析上分别提升15.0%和8.6%。同时,模型在多页文档处理速度上表现出色,达到每秒0.84页,远超其他同类工具。
2025-06-13 14:26:21
421
原创 端侧推理新标杆——MiniCPM 4本地部署教程:5%稀疏度实现128K长文本7倍加速,低成本训练开销匹敌Qwen3-8B
MiniCPM 4 是一个极致高效的端侧大模型,从模型架构、学习算法、训练数据与推理系统四个层面进行了高效优化,实现了极致的效率提升。高效模型架构:InfLLM v2 -- 可训练的稀疏注意力机制:采用可训练的稀疏注意力机制架构,在 128K 长文本处理中,每个词元仅需与不足 5% 的词元进行相关性计算,显著降低长文本的计算开销高效学习算法:模型风洞 2.0 -- 高效 Predictable Scaling:引入下游任务的 Scaling 预测方法,实现更精准的模型训练配置搜索。
2025-06-12 17:35:25
1153
原创 RAGFlow全新升级!RAGFlow v0.19.0 本地部署教程:开源RAG平台迈向智能新纪元!
5月26日,开源RAG(Retrieval-Augmented Generation)流程管理平台RAGFlow正式发布v0.19.0版本,以跨语言搜索、Agent代码组件、图像直显功能为核心,带来了一场智能交互领域的革新。这款面向AI知识检索与对话管理的平台,凭借其多语言、多模态、多引擎集成的特性,正在为企业构建高效智能问答及知识服务系统提供全新可能。
2025-06-11 17:47:31
1151
2
原创 ChatGPT革命升级!o3-pro模型重磅发布,奥特曼亲述“温和奇点”时代来临
ChatGPT进化:o3-pro重塑AI生产力,奥特曼宣告“温和奇点”正悄然开启新纪元。
2025-06-11 17:14:18
454
原创 DeepSeek-R1-0528-Qwen3-8B 本地部署教程:DeepSeek 开源高质量推理链,实力媲美巨头
前不久,DeepSeek R1 模型进行了一个小版本升级,当前版本为 DeepSeek-R1-0528。是由中国 AI 实验室 DeepSeek 于 2025 年 5 月底发布的一款轻量级开源模型,它基于 Qwen3-8B Base 模型,通过蒸馏微调而成。该思维链对于推理模型的学术研究以及专注于小规模模型的工业开发具有重要意义。
2025-06-10 17:40:35
1220
原创 字节开源代码模型——Seed-Coder 本地部署教程,模型自驱动数据筛选,让每行代码都精准落位!
Seed-Coder 由字节跳动于 2025 年 5 月开源,是一款专注于代码生成、补全与推理的(基于 Llama 3 架构),支持,包含三个变体,以为核心创新,显著减少人工干预,提升代码生成质量与效率。🌟 亮点以模型为中心: Seed-Coder 主要利用 LLM 而不是手工制作的规则来过滤代码数据,从而最大限度地减少预训练数据构建中的手动工作。透明:我们公开分享以模型为中心的数据管道的详细见解,包括管理 GitHub 数据、提交数据和代码相关的网络数据的方法。
2025-06-09 17:53:07
976
原创 AI高考大乱斗!六大顶尖模型挑战高考数学题,结论却引发争议
当6大模型共同挑战高考数学新一卷:豆包和元宝并列第一,OpenAI o3垫底,然而,这样的结论却引发了争议。
2025-06-09 17:37:56
345
原创 6GB显存玩转SD微调!LoRA-scripts本地部署教程,一键炼出专属AI画师
LoRA-scripts(又名 SD-Trainer),是一个专为设计的开源工具集主要应用于Stable Diffusion等AI绘图模型的微调,帮助用户高效创建定制化风格、角色或概念的轻量级模型。目前已经包含FLUX模型的lora训练。
2025-06-06 18:52:42
833
原创 碾压 Qwen2.5-VL,图像生成媲美 SD3!字节跳动开源 BAGEL本地部署教程
BAGEL是一个开源的多模态基础模型,具有 70 亿个激活参数(总共 140 亿个),并在大规模交错多模态数据上进行训练。BAGEL 在标准多模态理解排行榜上超越了当前顶级的开源 VLMs 如 Qwen2.5-VL 和 InternVL-2.5,并且提供了与强大的专业生成器如 SD3 竞争的文本到图像质量。此外,BAGEL 在经典的图像编辑场景中展示了比领先的开源模型更好的定性结果。更重要的是,它扩展到了自由形式的视觉操作、多视图合成和世界导航,这些能力构成了超出以往图像编辑模型范围的“世界建模”任务。
2025-06-05 19:17:59
1066
原创 中国AI全面突围!互联网女皇340页终极报告揭示全球AI新秩序
340页重磅报告勾勒出一幅激烈变革的AI版图,中国力量正以前所未有的速度改写硅谷主导的游戏规则。
2025-06-05 18:47:37
555
原创 可视化工作流引擎——FlowGram 本地部署教程:让百万级节点工作流流畅如丝!
FlowGram 是一套基于节点编辑的流程搭建引擎,通过自研 Canvas 渲染引擎,可支持200+ 节点流畅操作(60FPS)。该引擎可帮助开发者快速创建固定布局或自由连线布局模式的流程,并提供一套交互的最佳实践, 很适合有明确输入和输出的可视化工作流。
2025-06-04 17:45:40
475
原创 AI能“读懂人心”?Hume AI重磅发布EVI 3:精准捕捉人类情绪,情感计算碾压GPT-4o!
当AI学会“察言观色”:Hume AI EVI 3横空出世,情感计算能否改写人机交互规则?
2025-06-03 17:43:17
295
原创 开源量子模拟引擎:Quantum ESPRESSO本地部署教程,第一性原理计算轻松入门!
Quantum ESPRESSO 是一个用于电子结构计算和纳米尺度材料建模的开源计算机代码集成套件,专门用于进行第一性原理(第一性原理)计算,涵盖了电子结构、晶体学和材料性能的模拟。Quantum ESPRESSO GPU 版本支持GPU加速,该部署版本为q-e-7.4.1。发布 · QEF - Quantum ESPRESSO Foundation / q-e · GitLab。
2025-06-03 17:42:49
804
原创 NAMD本地部署教程:从 10 亿原子到生命奥秘,解锁分子动力学新维度
NAMD(Nanoscale Molecular Dynamics)是一款高性能分子动力学模拟软件,专为大规模生物分子系统设计,支持多核CPU/GPU集群及超算平台,可高效模拟百万原子级体系(如蛋白质折叠、膜蛋白转运)。该部署为NAMD 3.0.1版本,支持多核 CPU 和 GPU 加速,以 CUDA 优化的方式进行并行计算,极大提升了大型分子体系的模拟速度。其高效的并行架构使得 NAMD 能够在超级计算机、集群和工作站上高效运行。
2025-05-30 18:18:50
1063
原创 并肩谷歌,DeepSeek成全球第二大AI实验室!中国AI如何改写全球开源版图?
DeepSeek再创历史:以68分并肩谷歌,将Meta、Anthropic甩在身后,成为全球第二大AI实验室。
2025-05-30 18:06:30
420
原创 国产分子动力学引擎——GPUMD本地部署教程:专为 NVIDIA GPU 加速设计
GPUMD 是一款开源分子动力学模拟软件,由渤海大学樊哲勇教授团队主导开发,2017年首发1.0版本,持续迭代至3.9.4版本,是国内首个完全基于GPU加速的开源分子动力学软件,专为 NVIDIA GPU 加速设计。它使用 CUDA 提高计算效率,能够快速模拟原子尺度的物理过程。
2025-05-29 15:47:29
1472
原创 DeepSeek-R1重磅升级!发布数小时撼动全球:单挑Claude 4的国产最强推理模型
凌晨的AI圈,DeepSeek的一场低调升级正改写全球AI格局。
2025-05-29 15:35:14
527
原创 万亿原子,毫秒轨迹——LAMMPS本地部署教程:解锁材料演化密码
LAMMPS 官方手册LAMMPS ("Large-scale Atomic/Molecular Massively Parallel Simulator",大尺度原子/分子并行模拟工具)是一个经典的分子动力学模拟程序,由桑迪亚国家实验室开发。LAMMPS 提供了元素周期表中对应原子的经验势函数,能够开展与实际体系相符的分子动力学模拟。例如,可以计算金属铝的晶格常数或水的密度,并获得与实验结果一致的数值。
2025-05-28 18:08:40
1100
原创 开源多模态新标杆——BAGEL本地部署教程:7B参数撬动万亿数据
BAGEL,这是一个开源的多模态基础模型,具有 70 亿个激活参数(总共 140 亿个),并在大规模交错多模态数据上进行训练。BAGEL 在标准多模态理解排行榜上超越了当前顶级的开源 VLMs 如 Qwen2.5-VL 和 InternVL-2.5,并且提供了与强大的专业生成器如 SD3 竞争的文本到图像质量。此外,BAGEL 在经典的图像编辑场景中展示了比领先的开源模型更好的定性结果。
2025-05-27 17:48:25
1524
1
原创 GROMACS 本地部署教程:模拟生命密码,解码科学未来!
GROMACS 是一个用于执行分子动力学计算的通用软件包,即模拟包含数百到数百万个粒子的系统的牛顿运动方程,它是一个开源的项目。它主要设计用于具有大量复杂键合相互作用的生物化学分子,如蛋白质、脂质和核酸,但由于 GROMACS 在计算非键合相互作用(通常主导模拟)方面速度极快,许多研究小组也用它来研究非生物系统,例如聚合物和流体动力学。
2025-05-26 17:47:03
1032
原创 全球首届机器人格斗赛燃爆现场!揭秘机器人如何用AI打出花式动作
当宇树G1人形机器人挥舞着手臂,在擂台上施展勾拳、侧踢、膝击等花式动作时,这场全球首场人形机器人格斗大赛,既是AI技术的高燃秀场,更是人形机器人从实验室迈向实战的里程碑——AI与硬件的协同进化正悄然改写科技边界。
2025-05-26 17:38:26
356
原创 B站最新开源:最强动漫视频生成模型Index-AniSora本地部署教程,专为二次元打造
该项目展示了 Bilibili 为动漫世界带来的礼物——Index-AniSora,最强大的开源动漫视频生成模型。它支持一键创建多种动漫风格的视频片段,包括系列剧集、中国原创动画、漫画改编、VTuber 内容、动漫 PV、鬼畜动画等!由我们被 IJCAI'25 接受的工作AniSora: 探索天空时代动画视频生成的前沿提供支持。动画在最近的影视行业中引起了极大的兴趣。尽管像 Sora、Kling 和 CogVideoX 这样的先进视频生成模型在生成自然视频方面取得了成功,但在处理动画视频时却缺乏同样的效果。
2025-05-23 17:30:42
1246
原创 Claude 4震撼发布!7小时编程封王,AI下一站:智能体对决时代来临
Claude 迎来重磅升级:7 小时自主编程改写人机协作模式,更揭示了AI的下一战。
2025-05-23 17:26:31
702
原创 国产AI登顶时刻:全球首个“AI版Office”登顶榜首,办公领域迎来颠覆性变革
AI版Office时代来临:传统的Office软件,即将被彻底颠覆。
2025-05-22 17:34:27
625
原创 动漫党福音!B站开源最强动漫视频生成模型,专为二次元打造
B站开源首个专为二次元视频生成打造的AI模型Index-AniSora,不仅支持多元风格的一键生成,更凭借IJCAI25多项SOTA成绩与千万级高质量数据训练,成为最强动漫视频生成模型。
2025-05-20 18:15:09
495
原创 LTX-Videov本地部署教程:时空扩散+多尺度渲染,重塑AI视频研究范式
ComfyUI是一个强大的、模块化的界面与后端项目。该用户界面将允许用户使用基于图形/节点/流程图的界面设计和执行高级稳定的扩散管道。目前全面支持SD1.xSD2.xSDXLSD3和命令行选项:--lowvram使其在显存小于 1GB 的 GPU 上运行(在显存较低的 GPU 上自动启用)即使没有 GPU,也可以工作:--cpu(慢)可以加载ckpt和。独立 VAE 和 CLIP 模型从生成的 PNG 文件加载完整的工作流程(带有种子)将工作流程保存/加载为 Json 文件。
2025-05-20 18:14:34
849
原创 MatterGen本地部署教程:逆向材料设计新范式——扩散模型驱动,一键生成未来材料!
MatterGen 是一种用于跨周期表设计无机材料的生成模型,可以微调以引导生成满足广泛性能约束条件。MatterGen 的基础模型在生成新颖、稳定且多样化的材料方面已达到领先水平(如图所示)。该模型利用来自。
2025-05-19 17:51:58
1640
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人