大家好,我是大头,98年,职高毕业,上市公司架构师,大厂资深开发,管理过10人团队。
ChatGPT要被DeepSeek取代了?
大家都知道,目前的AI方面可以说是GPT遥遥领先,大部分的国产大模型还是在追赶的路上的。
可是,现在!我国的国产大模型出现了一个巨大利好!那就是DeepSeek诞生了!
DeepSeek是由知名量化资管巨头幻方量化创立,目前最新发布的DeepSeek R1
模型,对标OpenAI o1
模型,已经可以免费体验了!
这可以说是国产大模型的巨大进步!
DeepSeek的发展
DeepSeek成立于2023年7月17日,由知名量化资管巨头幻方量化创立。DeepSeek 是一家创新型科技公司,长久以来专注于开发先进的大语言模型(LLM)和相关技术,作为大厂外唯一一家储备万张 A100 芯片的公司,幻方量化为DeepSeek的技术研发提供了强大的硬件支持。
2023年8月2日,注册资本变更为1000万元,章程备案,投资人变更为宁波程恩企业管理咨询合伙企业,市场主体类型变更为其他有限责任公司。
2024年9月5日,DeepSeek 官方更新 API 支持文档,宣布合并 DeepSeek Coder V2 和 DeepSeek V2 Chat 两个模型,升级推出全新的 DeepSeek V2.5 新模型。官方表示为向前兼容,API 用户通过 deepseek-coder 或 deepseek-chat 均可以访问新的模型。
2024年12 月,一份关于 DeepSeek 发布历程、优化方向的专家会议纪要文件在业内流传。对此,DeepSeek 回应称,公司未授权任何人员参与券商投资者交流会,所谓“DeepSeek 专家”非公司人员,所交流信息不实。DeepSeek 表示,公司内部制定有严格的规章制度,明令禁止员工接受外部访谈、参与投资者交流等市场上各类面向投资者的机构信息交流会。相关事项均以公开披露信息为准。
2025年1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。根据公开报道,DeepSeek的员工规模不及OpenAI的1/5,百人出头的公司中,算子、推理框架、多模态等研发工程师以及深度学习方面的研究人员共有约70人,主要在北京分部,其余30多人在杭州总部,多为前端、产品以及商务人员。
下面是DeepSeek的网址,大家可以打开自己感受一下效果!
https://www.deepseek.com/
实际使用
我们可以看到DeepSeek目前登顶了中国区和美国区下载排行榜,更是超过了ChatGPT。
但是只有实际使用,才能知道大模型的能力。
大头这次问了大模型两个问题,来进行对比,大家一起看看吧!
- 第一个问题是“使用JAVA帮我写一个备忘录的代码”,这个问题主要是看一下两个模型的代码能力。
首先是DeepSeek
。 可以看到基本没啥问题。
import java.util.ArrayList;
import java.util.Scanner;
public class MemoApp {
private static ArrayList<String> memos = new ArrayList<>();
private static Scanner scanner = new Scanner(System.in);
public static void main(String[] args) {
while (true) {
System.out.println("\n备忘录菜单:");
System.out.println("1. 添加备忘录");
System.out.println("2. 查看备忘录");
System.out.println("3. 删除备忘录");
System.out.println("4. 退出");
System.out.print("请选择操作: ");
int choice = scanner.nextInt();
scanner.nextLine(); // 清除缓冲区
switch (choice) {
case 1:
addMemo();
break;
case 2:
viewMemos();