0x00 前言
DeepSeek的核心技术包括深度学习模型、自然语言处理(NLP)、数据挖掘与知识图谱等。其深度神经网络(DNN)能够自动提取数据的特征,理解数据的上下文语义,从而实现更智能化的搜索与分析。DeepSeek的混合专家模型(Mixture-of-Experts, MoE)架构和创新的训练策略使其在各种基准测试中表现出色。
DeepSeek的主要产品包括DeepSeek-V3、DeepSeek-V2系列模型、DeepSeek Coder等。DeepSeek-V3是一款强大的混合专家模型,拥有671亿个参数,能够在各种基准测试中与GPT-4相媲美,且训练成本仅为557.6万美元,相比之下GPT-4的训练成本约为1亿美元。DeepSeek Coder则支持多种编程语言,性能在全球范围内名列前茅,尤其擅长代码生成和数学算术任务。
0x01 准备工具
Ollama(https://ollama.com/download),下载windows版
Chatbox(https://chatboxai.app/zh),下载windows版