- 博客(354)
- 收藏
- 关注
原创 技术伦理之争:OpenAI陷抄袭风波,法院强制下架宣传视频
初创公司IYO控诉OpenAI窃取其智能耳塞技术专利,一场关乎巨头伦理与初创生存的天价诉讼,正撼动AI硬件格局。
2025-06-24 19:55:52
272
原创 空间智能觉醒!蚂蚁ViLaSR-7B突破人类思维屏障,让大模型首次具备人类空间思维能力!
李飞飞、谢赛宁团队去年末发布的VSI-Bench基准(涵盖288个真实场景视频、5000+问答对)首次量化了AI的空间认知缺陷:在物体相对方向、距离估计等任务中,15个主流MLLM的**错误率高达71%源于空间推理短板,而非视觉识别或语言理解。随着“绘图推理”范式与VSI-Bench等评估工具的双轮驱动,AI终于开始用人类的视角丈量世界——从识别物体到理解空间,这场感知革命才刚刚开始。这种边看边画、边画边想的交互模式,模拟了人类解决空间问题时用草图辅助思考的本能行为,显著提升了时空信息的保留效率。
2025-06-23 20:14:32
241
原创 特斯拉纯视觉Robotaxi突袭奥斯汀:9年磨剑,首战公共道路
当方向盘后的控制权逐渐交还给算法,我们正在见证的不仅是技术迭代,更是文明形态的跃迁。在这场没有硝烟的战争中,马斯克用十年时间画下的"饼",正在变成改变世界的现实图景。而更深远的影响在于,若自动驾驶成为未来主要出行方式之一,一个覆盖出行、能源、娱乐的闭环生态可能将彻底改变城市交通格局,并重塑出行市场的经济模型。在自动驾驶技术屡遭寒冬的行业里,特斯拉用一场近乎"史诗级长跑"的坚持,将无人驾驶出租车从科幻概念推向现实,更将。在马斯克的蓝图中,Robotaxi不是简单的移动工具,而是移动生活空间的延伸。
2025-06-23 18:48:16
305
原创 开源新王MiniMax -M1 vLLM本地部署教程:百万级上下文支持成大模型领域新标杆!
MiniMax-M1 型号可以在配备 8 个 H800 或 8 个 H20 GPU 的单个服务器上高效运行。在硬件配置方面,配备 8 个 H800 GPU 的服务器可以处理多达 200 万个令牌的上下文输入,而配备 8 个 H20 GPU 的服务器可以支持高达 500 万个令牌的超长上下文处理能力。,凭借其百万级上下文支持、超高效计算性能和突破性成本表现,成为大模型领域的新标杆。为了保证部署环境的一致性和稳定性,我们建议使用 Docker 进行部署。💡 如果您使用的是其他环境配置,请参阅。
2025-06-20 17:51:18
563
原创 AI Agent落地桌面!Manus Windows版正式推出,免码安装:代码/报告一键生成
曾需万元邀请码的Manus AI,其Windows桌面应用正式开放,免码畅享。
2025-06-20 13:01:11
203
原创 Dify 推出全新版本!Dify-v1.4.3本地部署教程:开发效率飙升,快速打造 AI 应用!
是一款开源的大语言模型(LLM) 应用开发平台。它融合了后端即服务(Backend as Service)和的理念,使开发者可以快速搭建生产级的生成式 AI 应用。即使你是非技术人员,也能参与到 AI 应用的定义和数据运营过程中。由于 Dify 内置了构建 LLM 应用所需的关键技术栈,包括对数百个模型的支持、直观的 Prompt 编排界面、高质量的 RAG 引擎、稳健的 Agent 框架、灵活的流程编排,并同时提供了一套易用的界面和 API。
2025-06-19 18:51:09
970
1
原创 一文看懂AI算力类型,开启你的AI学习之旅!
在人工智能的世界里,算力,看似无形,却拥有着改变一切的强大力量。对于刚踏入AI领域的初学者来说,理解算力如何支撑AI训练等过程,以及不同类型算力的区别,是开启AI学习大门的关键一步。简单来说,算力就是计算机进行数据处理和运算的能力。在AI训练中,我们会给模型输入大量的数据,就像给一个超级“学生”提供海量的学习资料。而这个“学生”要从这些资料里总结出规律,学会如何完成各种任务,比如图像识别、语言翻译等。这个学习过程,也就是训练,需要进行巨量的计算。
2025-06-18 17:41:36
538
原创 谷歌性价比之王 Gemini 2.5 Flash-Lite发布:最快轻量版AI模型!
谷歌AI家族迎来最具性价比成员:不仅能实时生成操作系统界面,还是最快、成本最低的型号。
2025-06-18 17:07:15
465
原创 开源新王诞生!MiniMax-M1正式发布,超强上下文能力剑指DeepSeek!
一百万token上下文窗口,八倍于DeepSeek R1的处理长度,训练成本仅53万美元——沉寂已久的AI六小虎之一MiniMax用开源新模型重新定义了性价比。
2025-06-17 16:25:17
410
原创 Qwen3-Embedding-Reranker本地部署教程:8B 参数登顶 MTEB 多语言榜首,100 + 语言跨模态检索无压力!
Qwen3-Embedding与Qwen3-Reranker是阿里巴巴通义实验室于今年6月开源的双模型系列,专为文本表征、检索与排序任务设计。基于Qwen3基础模型构建,二者通过协同工作显著提升语义理解与信息检索效率,在多语言场景和工业部署中表现卓越。基于 Qwen3 系列的密集基础模型,提供了各种大小(0.6B、4B 和 8B)的全面文本嵌入和重新排序模型。该系列继承了其基础模型出色的多语言能力、长文本理解和推理技能。
2025-06-16 19:25:21
729
原创 告别复杂文档解析噩梦!MonkeyOCR 本地部署教程:支持公式/表格多元素结构化
MonkeyOCR 是华中科技大学联合金山办公(Kingsoft Office)推出的文档解析模型,模型支持高效地将非结构化文档内容转换为结构化信息。基于精确的布局分析、内容识别和逻辑排序,显著提升文档解析的准确性和效率。与传统方法相比,MonkeyOCR在处理复杂文档(如包含公式和表格的文档)时表现出色,平为性能提升5.1%,在公式和表格解析上分别提升15.0%和8.6%。同时,模型在多页文档处理速度上表现出色,达到每秒0.84页,远超其他同类工具。
2025-06-13 14:26:21
480
原创 端侧推理新标杆——MiniCPM 4本地部署教程:5%稀疏度实现128K长文本7倍加速,低成本训练开销匹敌Qwen3-8B
MiniCPM 4 是一个极致高效的端侧大模型,从模型架构、学习算法、训练数据与推理系统四个层面进行了高效优化,实现了极致的效率提升。高效模型架构:InfLLM v2 -- 可训练的稀疏注意力机制:采用可训练的稀疏注意力机制架构,在 128K 长文本处理中,每个词元仅需与不足 5% 的词元进行相关性计算,显著降低长文本的计算开销高效学习算法:模型风洞 2.0 -- 高效 Predictable Scaling:引入下游任务的 Scaling 预测方法,实现更精准的模型训练配置搜索。
2025-06-12 17:35:25
1188
原创 RAGFlow全新升级!RAGFlow v0.19.0 本地部署教程:开源RAG平台迈向智能新纪元!
5月26日,开源RAG(Retrieval-Augmented Generation)流程管理平台RAGFlow正式发布v0.19.0版本,以跨语言搜索、Agent代码组件、图像直显功能为核心,带来了一场智能交互领域的革新。这款面向AI知识检索与对话管理的平台,凭借其多语言、多模态、多引擎集成的特性,正在为企业构建高效智能问答及知识服务系统提供全新可能。
2025-06-11 17:47:31
1202
2
原创 ChatGPT革命升级!o3-pro模型重磅发布,奥特曼亲述“温和奇点”时代来临
ChatGPT进化:o3-pro重塑AI生产力,奥特曼宣告“温和奇点”正悄然开启新纪元。
2025-06-11 17:14:18
554
原创 DeepSeek-R1-0528-Qwen3-8B 本地部署教程:DeepSeek 开源高质量推理链,实力媲美巨头
前不久,DeepSeek R1 模型进行了一个小版本升级,当前版本为 DeepSeek-R1-0528。是由中国 AI 实验室 DeepSeek 于 2025 年 5 月底发布的一款轻量级开源模型,它基于 Qwen3-8B Base 模型,通过蒸馏微调而成。该思维链对于推理模型的学术研究以及专注于小规模模型的工业开发具有重要意义。
2025-06-10 17:40:35
1323
原创 字节开源代码模型——Seed-Coder 本地部署教程,模型自驱动数据筛选,让每行代码都精准落位!
Seed-Coder 由字节跳动于 2025 年 5 月开源,是一款专注于代码生成、补全与推理的(基于 Llama 3 架构),支持,包含三个变体,以为核心创新,显著减少人工干预,提升代码生成质量与效率。🌟 亮点以模型为中心: Seed-Coder 主要利用 LLM 而不是手工制作的规则来过滤代码数据,从而最大限度地减少预训练数据构建中的手动工作。透明:我们公开分享以模型为中心的数据管道的详细见解,包括管理 GitHub 数据、提交数据和代码相关的网络数据的方法。
2025-06-09 17:53:07
991
原创 AI高考大乱斗!六大顶尖模型挑战高考数学题,结论却引发争议
当6大模型共同挑战高考数学新一卷:豆包和元宝并列第一,OpenAI o3垫底,然而,这样的结论却引发了争议。
2025-06-09 17:37:56
353
原创 6GB显存玩转SD微调!LoRA-scripts本地部署教程,一键炼出专属AI画师
LoRA-scripts(又名 SD-Trainer),是一个专为设计的开源工具集主要应用于Stable Diffusion等AI绘图模型的微调,帮助用户高效创建定制化风格、角色或概念的轻量级模型。目前已经包含FLUX模型的lora训练。
2025-06-06 18:52:42
870
原创 碾压 Qwen2.5-VL,图像生成媲美 SD3!字节跳动开源 BAGEL本地部署教程
BAGEL是一个开源的多模态基础模型,具有 70 亿个激活参数(总共 140 亿个),并在大规模交错多模态数据上进行训练。BAGEL 在标准多模态理解排行榜上超越了当前顶级的开源 VLMs 如 Qwen2.5-VL 和 InternVL-2.5,并且提供了与强大的专业生成器如 SD3 竞争的文本到图像质量。此外,BAGEL 在经典的图像编辑场景中展示了比领先的开源模型更好的定性结果。更重要的是,它扩展到了自由形式的视觉操作、多视图合成和世界导航,这些能力构成了超出以往图像编辑模型范围的“世界建模”任务。
2025-06-05 19:17:59
1079
原创 中国AI全面突围!互联网女皇340页终极报告揭示全球AI新秩序
340页重磅报告勾勒出一幅激烈变革的AI版图,中国力量正以前所未有的速度改写硅谷主导的游戏规则。
2025-06-05 18:47:37
560
原创 可视化工作流引擎——FlowGram 本地部署教程:让百万级节点工作流流畅如丝!
FlowGram 是一套基于节点编辑的流程搭建引擎,通过自研 Canvas 渲染引擎,可支持200+ 节点流畅操作(60FPS)。该引擎可帮助开发者快速创建固定布局或自由连线布局模式的流程,并提供一套交互的最佳实践, 很适合有明确输入和输出的可视化工作流。
2025-06-04 17:45:40
523
原创 AI能“读懂人心”?Hume AI重磅发布EVI 3:精准捕捉人类情绪,情感计算碾压GPT-4o!
当AI学会“察言观色”:Hume AI EVI 3横空出世,情感计算能否改写人机交互规则?
2025-06-03 17:43:17
388
原创 开源量子模拟引擎:Quantum ESPRESSO本地部署教程,第一性原理计算轻松入门!
Quantum ESPRESSO 是一个用于电子结构计算和纳米尺度材料建模的开源计算机代码集成套件,专门用于进行第一性原理(第一性原理)计算,涵盖了电子结构、晶体学和材料性能的模拟。Quantum ESPRESSO GPU 版本支持GPU加速,该部署版本为q-e-7.4.1。发布 · QEF - Quantum ESPRESSO Foundation / q-e · GitLab。
2025-06-03 17:42:49
813
原创 NAMD本地部署教程:从 10 亿原子到生命奥秘,解锁分子动力学新维度
NAMD(Nanoscale Molecular Dynamics)是一款高性能分子动力学模拟软件,专为大规模生物分子系统设计,支持多核CPU/GPU集群及超算平台,可高效模拟百万原子级体系(如蛋白质折叠、膜蛋白转运)。该部署为NAMD 3.0.1版本,支持多核 CPU 和 GPU 加速,以 CUDA 优化的方式进行并行计算,极大提升了大型分子体系的模拟速度。其高效的并行架构使得 NAMD 能够在超级计算机、集群和工作站上高效运行。
2025-05-30 18:18:50
1069
原创 并肩谷歌,DeepSeek成全球第二大AI实验室!中国AI如何改写全球开源版图?
DeepSeek再创历史:以68分并肩谷歌,将Meta、Anthropic甩在身后,成为全球第二大AI实验室。
2025-05-30 18:06:30
426
原创 国产分子动力学引擎——GPUMD本地部署教程:专为 NVIDIA GPU 加速设计
GPUMD 是一款开源分子动力学模拟软件,由渤海大学樊哲勇教授团队主导开发,2017年首发1.0版本,持续迭代至3.9.4版本,是国内首个完全基于GPU加速的开源分子动力学软件,专为 NVIDIA GPU 加速设计。它使用 CUDA 提高计算效率,能够快速模拟原子尺度的物理过程。
2025-05-29 15:47:29
1494
原创 DeepSeek-R1重磅升级!发布数小时撼动全球:单挑Claude 4的国产最强推理模型
凌晨的AI圈,DeepSeek的一场低调升级正改写全球AI格局。
2025-05-29 15:35:14
532
原创 万亿原子,毫秒轨迹——LAMMPS本地部署教程:解锁材料演化密码
LAMMPS 官方手册LAMMPS ("Large-scale Atomic/Molecular Massively Parallel Simulator",大尺度原子/分子并行模拟工具)是一个经典的分子动力学模拟程序,由桑迪亚国家实验室开发。LAMMPS 提供了元素周期表中对应原子的经验势函数,能够开展与实际体系相符的分子动力学模拟。例如,可以计算金属铝的晶格常数或水的密度,并获得与实验结果一致的数值。
2025-05-28 18:08:40
1105
原创 开源多模态新标杆——BAGEL本地部署教程:7B参数撬动万亿数据
BAGEL,这是一个开源的多模态基础模型,具有 70 亿个激活参数(总共 140 亿个),并在大规模交错多模态数据上进行训练。BAGEL 在标准多模态理解排行榜上超越了当前顶级的开源 VLMs 如 Qwen2.5-VL 和 InternVL-2.5,并且提供了与强大的专业生成器如 SD3 竞争的文本到图像质量。此外,BAGEL 在经典的图像编辑场景中展示了比领先的开源模型更好的定性结果。
2025-05-27 17:48:25
1567
1
原创 GROMACS 本地部署教程:模拟生命密码,解码科学未来!
GROMACS 是一个用于执行分子动力学计算的通用软件包,即模拟包含数百到数百万个粒子的系统的牛顿运动方程,它是一个开源的项目。它主要设计用于具有大量复杂键合相互作用的生物化学分子,如蛋白质、脂质和核酸,但由于 GROMACS 在计算非键合相互作用(通常主导模拟)方面速度极快,许多研究小组也用它来研究非生物系统,例如聚合物和流体动力学。
2025-05-26 17:47:03
1040
原创 全球首届机器人格斗赛燃爆现场!揭秘机器人如何用AI打出花式动作
当宇树G1人形机器人挥舞着手臂,在擂台上施展勾拳、侧踢、膝击等花式动作时,这场全球首场人形机器人格斗大赛,既是AI技术的高燃秀场,更是人形机器人从实验室迈向实战的里程碑——AI与硬件的协同进化正悄然改写科技边界。
2025-05-26 17:38:26
358
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人