自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 GPU的PCIe 和 SXM接口的区别

选择PCIe还是SXM主要取决于你的具体需求。如果你正在构建一台家用电脑或者小型工作站,那么PCIe GPU将是更合适的选择;而对于那些需要极高性能和多GPU协同工作的企业级用户来说,采用SXM技术的产品则更能满足他们的要求。不过值得注意的是,SXM GPU往往伴随着更高的成本,并且不具备像PCIe那样的即插即用特性。

2025-04-01 16:08:33 320

原创 一文读懂到底什么是推理和训练,分别是什么场景

训练主要发生在模型开发阶段,侧重于学习模式并优化模型参数,通常消耗大量计算资源。推理则关注于将训练好的模型应用于实际问题中,做出预测或决策,强调响应速度和服务可靠性。了解这两者的区别有助于更有效地规划AI项目的架构设计、资源配置以及成本控制等方面的工作。无论是选择合适的硬件平台还是优化算法性能,都需考虑到训练和推理的不同需求。

2025-04-01 16:00:14 354

原创 为什么DeepSeek如此强大?一文读懂AI模型蒸馏与量化技术

作为一款国产大型语言模型,DeepSeek-R1拥有670亿参数的规模,超越了700亿参数的Llama 2,表现突出,可用于推理、数学和编程能力方面。而且它还支持文件上传和长文本对话,为编程代码开发、创意写作和文件处理等任务都提供了高效的AI支持。大语言模型(比如 GPT-4、DeepSeek 等)往往体积很大,计算资源需求高,部署成本高昂。但有时候,我们并不需要它们“全力以赴”,而是希望有个轻量级的模型,在手机、边缘设备、甚至一些低算力服务器上运行。

2025-03-28 14:26:50 940

原创 《生活不易 猫猫叹气》GPU算力资源的客户经理日常心路历程

理解需求,匹配解决方案每天都会接触到不同行业、不同规模的企业,他们对GPU算力的需求千差万别。从游戏开发公司到医疗研究机构,再到自动驾驶技术开发商,每个客户的挑战都是独一无二的。关键在于深入理解每一个客户的具体需求,并据此推荐最适合他们的GPU解决方案。这不仅需要扎实的技术知识,还需要良好的沟通技巧。

2025-03-27 15:50:29 356

原创 GPU算力资源怎么选?一文看懂英伟达A100、H100、A800、H800、H20等系列

万云智算作为一个专注于算力资源管理和大模型应用开发的平台,在全国布局四大自运营算力中心的同时,不仅覆盖主流算力A30、A100、H800等,而且还配置华为昇腾、百度昆仑芯等算力,满足国产化、信创产业等多样化需求。AI大模型的发展浪潮正加速中国算力基础设施的建立,其中英伟达A100、H100等GPU凭借强大的并行计算能力,正在主导中国AI大模型的训练与推理。英伟达芯片对中国算力市场和AI大模型发展的影响复杂且深远,既推动了技术进步,同时也加速了国产芯片技术的突破,如华为昇腾、昆仑芯片的崛起与突围。

2025-03-27 15:39:11 539

原创 万云智算加速AI应用落地生根!AI大模型私有化部署全面落地,精准适配各行业场景

针对大语言模型效果不好、存在幻觉等问题,人们通常关注大模型再训练、大模型微调、大模型的Prompt增强,但对于专业领域、快速更新的数据,却并没有较好的解决方法。目前,万云智算在多模态理解、工具调用、代码应用、深度问答与生成、逻辑推理与数字人智能应用等方面,具备完备解决方案,并应用于教育、医疗、电商、金融等重点行业。的流程编排,企业非技术人员通过自然语言交互,系统自动解析需求,并生成对应流程,实现企业自主搭建,主导整个开发过程。例如在处理医疗、法律、企业机密等隐私数据时,通过RAG“现用现查”的方式,

2025-03-21 10:49:32 572 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除