深度学习
文章平均质量分 94
Nerous_
#inculde 《stdio。h》
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【Deepseek】服务器部署Deepseek全流程
在服务器上部署 DeepSeek 模型需要细致的准备和配置,但通过上述步骤,您可以成功地在 Linux 服务器上运行并远程访问该模型。根据您的硬件条件和需求,选择合适的模型规模,并进行相应的优化,以获得最佳性能。希望本指南对您的部署过程有所帮助。。原创 2025-03-25 13:56:44 · 2401 阅读 · 1 评论 -
【NLP】 API在大语言模型中的应用
API是大语言模型落地应用的关键桥梁,开发者通过标准化接口即可快速获得:文本生成(如客服对话)、数据分析(如文档摘要)、自动化(如代码生成)等能力。实际开发中需重点关注提示工程优化异步性能调优和合规性控制。随着模型技术的演进,未来LLM API将向更低延迟、更低成本和更高专业性的方向发展。原创 2025-03-19 19:33:13 · 1881 阅读 · 3 评论 -
【深度学习】DeepSeek模型介绍与部署
我们提出了 DeepSeek-V3,一个强大的混合专家 (MoE) 语言模型,拥有 671B 总参数,其中每个 token 激活 37B 参数。为了实现高效推理和成本效益的训练,DeepSeek-V3 采用了多头潜在注意力 (MLA) 和 DeepSeekMoE 架构,这些架构在 DeepSeek-V2 中得到了充分验证。此外,DeepSeek-V3 首次提出了无辅助损失的负载平衡策略,并设置了多 token 预测训练目标,以增强性能。原创 2025-02-01 12:25:27 · 9666 阅读 · 0 评论 -
【深度学习】 UNet详解
我们将训练一个 UNet 模型,使用交叉熵损失函数和 Adam 优化器。训练时,输入的图像和标签将通过 DataLoader 加载。# 超参数# 数据加载# 初始化模型与优化器model = UNet(in_channels=3, out_channels=2).to(DEVICE) # 假设是二分类# 训练过程# 前向传播# 计算损失# 反向传播# 更新参数。原创 2025-01-26 12:25:46 · 7913 阅读 · 1 评论 -
【深度学习】 PyTorch一文详解
PyTorch详解原创 2025-01-12 21:13:25 · 2695 阅读 · 0 评论
分享