1. 梁文锋
背景:浙江大学信息与通信工程硕士,DeepSeek创始人。
主攻方向:主导公司战略方向,早期专注于算法研究(如低成本、高效率技术)和全自动量化交易探索,后将AI技术作为发展核心。
2. 高华佐
背景:北京大学物理系毕业。
主攻方向:负责技术架构创新,为DeepSeek-V2的MLA(Multi-Layer Architecture)架构提供关键性突破。
3. 曾旺丁
背景:北京邮电大学毕业。
主攻方向:参与MLA架构创新及多个核心项目研发。
4. 朱琪豪
背景:北京大学计算机学院软件研究所博士。
主攻方向:主导DeepSeek-Coder-V1的开发,专注于代码生成与优化领域。
5. 代达劢(mài)
背景:北京大学计算语言所博士。
主攻方向:参与DeepSeek从LLM v1到v3版本的全周期研发,聚焦语言模型迭代。
6. 吴俣(yǔ)
背景:北京航空航天大学博士。
主攻方向:领导后训练团队,优化模型在实际应用中的性能表现。
7. 郭达雅
背景:中山大学与微软亚洲研究院(MSRA)联合培养博士。
主攻方向:开发数学推理与代码生成大模型。
8. 罗福莉
背景:北京大学计算语言学硕士,曾任职阿里达摩院。
主攻方向:参与DeepSeek-V2研发,侧重自然语言处理与多模态技术融合。
9. 赵成钢
背景:清华大学超算领域专家,三届世界大学生超算竞赛冠军。
主攻方向:负责训练与推理基础架构的优化,提升模型计算效率。
10. 王炳宣
背景:北京大学元培学院硕士。
主攻方向:参与多模态应用项目开发,探索AI在跨领域场景的落地。
主攻方向总结:
技术架构:MLA架构创新(高华佐、曾旺丁)。
模型开发:代码生成(朱琪豪)、数学推理(郭达雅)、语言模型迭代(代达劢)。
工程优化:训练与推理效率提升(赵成钢)、后训练优化(吴俣)。
应用拓展:多模态技术(罗福莉、王炳宣)。
战略与创新:低成本算法与AI技术整合(梁文锋)。