DeepSeek学习篇
文章平均质量分 90
DeepSeek学习相关总结
alonewolf_99
技术之路上的笃行者,始于好奇,成于专注。技术之路,道阻且长,行则将至,让技术创造真实回响
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
DeepSeek本地私有化部署篇
方法1:使用WSLStep1, 打开 PowerShell(管理员权限),运行: wsl --install重启电脑后,WSL 会自动完成安装(默认安装Ubuntu)Step2, 安装 Ollama 在WSL 终端(Ubuntu)中运行:curl -fsSL https://ollama.com/install.sh | shStep3,启动Ollama 服务(保持此终端运行,另开一个新终端进行后续操作)方法2: 直接下载Windows 版。原创 2025-10-16 15:28:51 · 911 阅读 · 0 评论 -
DeepSeek的创新
DeepSeek-V3通过多项创新技术提升了计算效率与推理能力:1)采用MLA机制压缩键值缓存,显著减少显存占用;2)使用61个MoE模块实现稀疏激活,降低计算成本;3)创新混合精度框架(FP8)优化训练效率。在推理能力上,通过强化学习驱动的长链推理技术(CoT)达到顶尖水平,其思维链可处理数万字复杂问题。模型提供不同尺寸版本(1.5B-671B),满足从边缘设备到云端的不同需求,其中32B模型即可实现671B约90%性能。Qwen3系列模型也展现出多场景适配能力,支持119种语言和两种推理模式。原创 2025-10-16 12:14:35 · 802 阅读 · 0 评论
分享