- 博客(56)
- 收藏
- 关注
原创 Windsurf 下载和调试(超越cursor的免费的 AI IDE)
Windsurf 是一款由 Codeium 开发的 AI 驱动的代码编辑器,适合初学者和非程序员使用。它提供 AI 辅助编码、自动完成、自然语言交互等功能,帮助用户轻松学习编程。安装简单,支持 Mac、Windows 和 Linux,免费使用基本功能。通过示例项目(如 Python 的 “Hello, World!” 和简单网页),用户可以快速上手。什么是 Windsurf?Windsurf 是一款下一代 AI 增强的集成开发环境(IDE),旨在通过实时 AI 协作提升生产力。
2025-03-21 17:05:26
919
原创 codeforces系列题参考解析_001:有趣的图与苹果(深度优先搜索及类似、并查集、图论)
图的结构约束类问题这类问题通常要求在预设条件下构造或修改图结构约束条件往往涉及顶点度数、环的形成、连通性等解决方案需要满足某种最优性(如最小边数、字典序最小等)判断可行性与构造解首先需要判断问题是否有解如果有解,则需要按照特定规则构造出一个具体解贪心策略在图构造中的应用按照字典序或其他优先级规则逐步构造解每一步都选择当前最优的局部决策。
2025-03-18 21:47:03
871
原创 Python Web开发:Flask与Django框架比较与选择
Web 开发是创建网站或 Web 应用程序的过程,主要涉及三个层面:前端、后端和数据库。前端负责用户界面的呈现,让用户与网站进行交互;后端则处理业务逻辑,比如用户认证、数据处理等;数据库用于存储和管理应用程序的数据。从技术角度来看,Web 开发基于 HTTP 协议进行通信。当用户在浏览器中输入网址并访问时,浏览器会发送一个 HTTP 请求到服务器。服务器接收到请求后,根据请求的内容进行处理,然后返回一个 HTTP 响应给浏览器。
2025-03-14 14:50:41
1188
原创 CSV乱码解决:CSV转UTF-8 BOM格式转换工具
这是一款专注于单一功能的桌面应用:将CSV文件快速转换为UTF-8 BOM编码格式。它采用了直观的拖放界面,无需复杂设置,几秒钟内即可完成转换,让数据在Excel、数据库导入工具等各类应用中正确显示中文、日文等特殊字符。
2025-03-13 21:35:50
409
原创 Manus开源版本(免邀请满血版)下载和使用
OpenManus 是 Manus AI 的开源版本,旨在复制其核心功能,包括自主任务执行和工具集成。它的独特之处在于无需邀请码,任何开发者都可以克隆仓库并通过配置运行自己的 AI 代理。该项目由 MetaGPT 社区成员@MoshiQAQ和合作开发,展示了 AI 社区的快速创新能力。根据aibase.com 的报道,OpenManus 支持通过终端输入任务,驱动智能体执行操作,默认集成 GPT-4o 模型,用户可以根据需要调整配置。
2025-03-07 17:11:10
3723
原创 Manus AI全网资料参考
Manus AI是由中国初创公司Monica于2025年3月开发的完全自主AI代理,旨在处理复杂的现实世界任务,如市场研究、旅行规划和数据分析。它目前仅通过邀请预览提供,访问需通过官方网站。由于其新颖性,关于其技术架构的详细公开信息有限,但研究表明它采用多签名(multisig)方法,由多个独立模型驱动,计划在今年晚些时候开源部分推理组件。
2025-03-07 16:23:10
787
原创 DeepSeek优质文档与源码内容推荐
DeepSeek是2025年最有潜力的前沿大预言模型之一。为了方便大家快速上手学习,筛选了一下近期优快云上面一些DeepSeek主题的优秀TOP资源,节约搜索时间。
2025-02-21 18:16:51
813
原创 马斯克xAI Grok大模型每月可领取$150额度!
引言继Deepseek之后,马斯克旗下的xAI公司也加入了大模型竞争,发布了备受瞩目的Grok3模型,在多项权威测试中的表现超越了OpenAI和Deepseek的模型,这基于最近流行的“思维链(Chain Of Thought)”的推理机制。
2025-02-21 12:16:18
411
原创 DeepSeek vs OpenAI : 哪种AI模型最适合数据科学?
选择最合适的数据科学人工智能(AI)工具涉及评估性能、可及性和成本。Thu Vu的本指南提供了两个领先模型的深入比较:DeepSeek R1,一个,以及即将被OpenAI最新模型o3替代的OpenAI o1。通过分析它们在各种数据科学任务中的独特优势和局限性,您可以确定哪个模型最符合您的具体需求。从处理复杂编码任务到解释棘手图表,这两个模型都带来了独特的能力。DeepSeek R1在逻辑推理和适应性方面表现出色,而则以其速度和精致的输出令人印象深刻。但哪一个更适合您的需求呢?
2025-02-20 18:00:15
753
原创 探索混合可调专家(MoTE)技术:DeepSeek大型语言模型行为控制新突破
LLMs 已广泛融入各个领域,不同应用场景对其行为和能力的多样化需求,促使研究人员不断探索有效的适应性方法。提示工程:在 LLMs 常规聊天界面中发挥作用,通过精心构造提示激发模型的额外行为。它适用性广泛,即使是封闭源系统也可应用,但难以实现深度定制。目标导向微调:实现难度较高,需要专业知识以及对基础模型权重的访问权限或专门的微调 API。通过数据集整理和微调生成基础模型的新版本,不过该过程较为复杂。直接大脑干预:在推理过程中对模型进行针对性修改,改变神经网络子区域的权重和神经元激活状态。
2025-02-20 17:20:46
508
原创 在 Amazon Bedrock 上部署 DeepSeek R1 模型
在 Amazon Bedrock 上部署 DeepSeek R1 模型涉及使用自定义模型导入功能,它允许将外部微调的模型无缝集成到 Bedrock 环境中。这个过程使您能够利用 Bedrock 的无服务器基础设施和统一 API 进行高效的模型部署。
2025-02-20 16:12:38
394
原创 使用 RTX3090/RTX4090 本地部署 Deepseek-R1 包含蒸馏模型 (qwen-7B 和 llama-8B)
本文提供了在配备RTX3090/RTX4090 GPU的本地机器上设置和运行Deepseek-R1模型的脚本和说明。
2025-02-20 15:44:51
408
原创 DeepSeek-Coder-v2 开源 AI 编程助手
由 DeepSeek AI 团队开发的创新开源 AI 编程助手,旨在改变编程领域。这一先进的 AI 模型旨在与领先的专有模型竞争,在各种编码任务和基准测试中表现出色,使其成为开发者和 AI 爱好者不可或缺的工具。
2025-02-19 12:24:17
805
原创 DeepSeek-R1 – 新的开源AI模型,具有人类般的推理性能
DeepSeek-R1是最新的开源推理AI模型,代表了人工智能的重大进步。该模型在宽松的MIT许可证下发布,旨在鼓励商业使用、微调和社区驱动的创新。通过整合强化学习(RL)并遵循透明的发展理念,为像这样的专有系统提供了一个引人注目的替代方案。其开源特性和技术复杂性使其在快速发展的AI领域中脱颖而出。DeepSeek-R1基于开源开发的原则,依靠强化学习驱动,这一AI模型旨在具备强大的多功能性。
2025-02-19 12:23:23
981
原创 DeepSeek-R1 的构建过程:架构与训练解析
DeepSeek-R1 的架构利用 MoE 框架,多个专家网络处理输入的不同部分,每个查询仅激活一部分专家。这一策略使模型能够在不需要大规模人工标注的情况下,提高其逻辑一致性和适应能力。DeepSeek-R1 的训练方法不同于传统的监督学习,而是专注于。DeepSeek-R1 与行业领先的 AI 模型进行评估。训练数据分布在多个 GPU 上,允许参数的同步更新。的深入理解,以及它在 AI 领域中脱颖而出的原因。架构,允许动态分配计算资源给不同的专业组件。多个专门的网络,针对不同的知识领域进行训练。
2025-02-19 12:22:18
1082
原创 Deepseek-R1 工程师:强大的开源 AI 编码助手
你是否曾经面对一个杂乱的代码库,感到被眼前的任务数量压倒?无论你是一个同时处理多个项目的资深开发者,还是一个试图理解复杂工作流程的新手,编码有时会让人感觉像是在攀登一座陡峭的山。Deepseek 工程师,基于创新的 Deepseek-R1 模型,是一个开源的,旨在提升软件开发。通过将先进的推理能力与全面的功能集成,这个工具提高了生产力,自动化了工作流程,并简化了复杂的编码任务。其直观的和与现代开发工具的兼容性,使其成为各行业和项目开发者的多功能解决方案。
2025-02-19 12:20:41
541
原创 Deepseek-R1 评测:开源人工智能革命击败 GPT-4 和 Claude 3.5
将冗长文本浓缩为简洁、准确的摘要,节省时间并提高信息可及性。这些能力突显了 Deepseek-R1 在软件开发、学术研究、创意产业等领域转变工作流程的潜力。其以精准和高效处理多样化任务的能力,使其成为各行业用户的宝贵资产。
2025-02-19 12:19:52
855
原创 DeepSeek-R1 图解
DeepSeek-R1是人工智能进步稳步前进中最新的重要成果。对于机器学习研发社区来说,它是一个重要的发布,原因包括:免费订阅以接收新文章并支持我的工作。订阅它是一个开放权重模型,有较小的蒸馏版本它分享并反思了一种训练方法,用于复现类似OpenAI O1的推理模型。在这篇文章中,我们将了解它是如何构建的。内容:回顾:大型语言模型是如何训练的DeepSeek-R1训练方法1- 长链推理监督微调(SFT)数据2- 一个中间的高质量推理大语言模型(但在非推理任务上表现较差)
2025-02-19 12:18:33
1138
原创 Deepseek-R1 与 ChatGPT-4:为什么 Deepseek-R1 是未来经济实惠的 AI 创新
Deepseek R1 是一个领先的开源语言模型,在编码、推理和数学问题解决方面表现出色,通常在特定任务中超越专有模型如 O1,同时具有成本效益。它在编码任务中实现了 97% 的成功率,提供功能代码生成、调试支持和项目结构等高级功能,显著简化了开发者的工作流程。该模型的推理能力采用链式思维方法,使其能够解决逻辑难题和伦理困境,尽管在处理细微或隐含问题条件时偶尔会遇到困难。
2025-02-19 12:16:15
698
原创 Deepseek-r1 与 OpenAI-o1 – AI 推理性能比较
Deepseek 推出了其R1模型,因其有潜力与 OpenAI 最新产品竞争而引起关注。据报道,Deepseek R1 在基准测试中超越了 OpenAI 的 o1 Preview,旨在处理复杂推理任务,与 OpenAI 的 o1 Preview 一同推出,该模型建立在以强大性能著称的血统上。每个模型都有其独特的优势。Deepseek R1 的开源框架鼓励社区贡献,承诺加速进展和协作开发。与此同时,OpenAI 的 o1 Preview 在其前身的基础上构建,展示了持续的改进和处理多样任务的精细能力。
2025-02-19 12:15:04
854
原创 Deepseek-R1-Lite 开源 LLM 完全测试
你是否曾经在一个根本无法解决的编码问题上苦苦挣扎,或者盯着一个复杂的方程,希望能有一点额外的智力支持?如果是这样,你并不孤单。无论你是开发者、研究人员,还是单纯喜欢解决复杂难题的人,寻找既强大又易于使用的工具的挣扎都是非常熟悉的。这就是的用武之地。这个开源推理模型不仅仅是另一个 AI 工具——它是一个出色的选项,旨在应对需要深思熟虑、精确和适应性的挑战。从生成干净、功能齐全的代码到破解高级数学问题,它承诺使你的工作流程更加顺畅,结果更加出色。
2025-02-19 12:13:32
956
原创 Deepseek-R1:超越OpenAI的开源人工智能
想象一下,解决一个复杂的问题,就像在没有盒子上图案的情况下拼凑一个1000片的拼图。无论你是开发者、研究人员还是商业领袖,你可能都面临过不仅需要原始计算能力,还需要真正推理的挑战——分解任务、探索替代方案并随着时间推移完善解决方案。Deepseek R1应运而生,这是一种新的,承诺能够做到这一点,以极低的成本提供先进的推理能力。如果你曾希望有一种工具能够像你一样思考问题——但速度更快、效率更高——那么这可能就是你一直在等待的突破。
2025-02-19 12:12:36
839
原创 DeepSeek-R1:内部原理简析
DeepSeek-R1是由中国人工智能公司DeepSeek开发的开源推理模型,能够处理需要逻辑推理、数学问题求解和实时决策的任务。与传统的大型语言模型(LLMs)相比,DeepSeek-R1和OpenAI的o1等推理模型的独特之处在于它们能够展示得出结论的过程。如上图所示,使用DeepSeek-R1时,你可以看到它对提示词进行推理的步骤,这使得理解和必要时质疑其输出变得更加容易。这一能力使推理模型在需要可解释结果的领域(如研究或复杂决策)中具有优势。
2025-02-19 12:11:42
762
原创 DeepSeek-R1:特性、应用案例及与OpenAI的比较
DeepSeek-R1是一个下一代“以推理为先”的人工智能模型,旨在通过关注其得出结论的方式,超越传统语言模型。DeepSeek-R1及其前身DeepSeek-R1-Zero采用大规模强化学习(RL)技术构建,强调透明性、数学能力和逻辑一致性。关键要点:开源发布:DeepSeek提供主模型(DeepSeek-R1)及六个蒸馏变体(参数范围从1.5B到70B),并遵循MIT许可证。这种开放的方式在开发者和研究人员中引起了极大的兴趣。强化学习重点。
2025-02-19 12:07:51
896
原创 DeepSeek-R1:重新定义推理性能的开源人工智能
DeepSeek推动开放人工智能边界的使命通过其在MIT许可证下发布的DeepSeek-R1的突破性发布得以体现。DeepSeek-R1代表了人工智能发展的一个关键时刻,平衡了尖端性能与MIT许可证的开放性和可及性。DeepSeek-R1的性能与OpenAI的o1等专有模型相当,在逻辑推理、数学和编码等任务中表现出色。下发布,结合了先进的推理能力、经济性和可及性,为人工智能的发展设定了新的基准。DeepSeek邀请社区合作,进一步推动模型的发展,促进惠及更广泛受众的创新。
2025-02-19 12:05:50
891
原创 DeepSeek-v2.5 开源 LLM 性能测试 – 超越 Claude 3、GPT-4o 和 Google Gemini
DeepSeek 版本 2.5 是一个最先进的开源大型语言模型(LLM),已发布,展示了,在多项基准测试中表现出色。这个先进的模型是 DeepSeek 版本 2 0628 和 DeepSeek Coder 版本 2 0724 的融合,结合了它们的优势,创造出一个强大的工具,超越了领先的模型,如 GPT-4 Turbo、Claude 3 和 Google Gemini。凭借其增强的写作能力、改进的指令遵循能力和更好的人类偏好对齐,DeepSeek v2.5 为各种应用提供了多功能且具有成本效益的解决方案。
2025-02-19 12:04:06
880
原创 DeepSeek-V3 替代品 - 阿里巴巴的新 AI 模型
在本文中,我们将探讨 Qwen 2.5 在 *性能*、*架构* 和 *实际应用* 方面与 DeepSeek-V3 的比较。我们将分析它们在自然语言处理、推理、多模态功能和 AI 驱动的自动化方面的能力,分解它们的优缺点。如果你想知道 *阿里巴巴的 Qwen 2.5 是否优于 DeepSeek-V3*,或者哪个更适合你,请继续阅读详细比较。
2025-02-19 12:03:20
889
翻译 DeepSeek-V3解析 3: 无辅助损失的负载均衡
在本文中,我们解释了DeepSeekMoE中使用的无辅助损失负载均衡方法,这是DeepSeek模型中采用的主要架构创新之一。具体来说,我们首先介绍了混合专家(MoE)的基础知识,强调了负载均衡的重要性,并回顾了先前的解决方案,包括辅助损失方法和专家选择。然后,我们解释了DeepSeek的无损失负载均衡方法及其性能。我们的主要结论是,DeepSeek的无损失方法避免了引入梯度干扰,同时保持了因果性,其有效性通过原始论文的实证结果得到了证明。
2025-02-18 20:49:15
440
翻译 DeepSeek-V3解析 2: DeepSeekMoE
在本文中,我们通过餐厅类比解释了DeepSeekMoE,这是DeepSeek-V2和DeepSeek-V3等DeepSeek模型中采用的主要架构创新之一。具体来说,我们介绍了MoE的一般工作原理、其优势和挑战,以及专家专业化与知识共享之间的权衡。随后,我们解释了DeepSeekMoE中的两个关键元素:细粒度专家分割和共享专家隔离。我们还在评估部分讨论了其性能。作为我们的主要收获,DeepSeekMoE通过促进专家专业化,在与通用MoE架构相当的计算成本下实现了更好的结果,从而提高了计算效率。
2025-02-18 20:45:10
45
翻译 DeepSeek-V3解析1:多头潜在注意力
作者使用ChatGPT创建的图片。这是我们新系列"DeepSeek-V3解析"的第一篇文章,我们将尝试揭开DeepSeek开源的最新模型DeepSeek-V3 [1, 2]的神秘面纱。在这个系列中,我们旨在涵盖两个主要主题:DeepSeek-V3的主要架构创新,包括MLA(多头潜在注意力)[3]、DeepSeekMoE [4]、无辅助损失的负载均衡[5]以及多token预测训练。DeepSeek-V3的训练,包括预训练、微调和强化学习对齐阶段。本文主要聚焦于。
2025-02-18 20:42:46
77
原创 DeepSeek错误代码完整列表及其故障排除方法 [终极指南]
在使用时遇到错误代码可能会令人烦恼,尤其是在您依赖该工具进行关键任务时。理解这些错误代码并有效地进行故障排除是保持生产力和最小化干扰的关键。无论是还是,每个错误代码都有独特的解决方案,可以帮助您恢复正常。在本中,我们创建了一个,以及逐步的故障排除方法,以帮助您解决常见问题。从到和,我们提供了实用的修复方法,可以为您节省时间和精力。DeepSeek错误代码及修复的完整列表。
2025-02-18 20:40:20
2264
原创 DeepSeek震撼AI世界——Qwen2.5-Max如何改变游戏规则
这在AI社区引发了严肃的讨论,专家和企业家纷纷发表看法,探讨AI领域的快速变化。作为背景,当OpenAI的首席执行官Sam Altman在2023年被问及小团队是否能以有限的预算构建出实质性的AI模型时,他自信地宣称这是“完全无望的”。通过支持文档分析,Qwen2.5-Max能够从PDF、图像和其他文档中提取有价值的见解,使其成为处理大量文书工作和数据提取的企业的理想工具。与大多数需要时间生成内容的AI视频工具不同,Qwen2.5-Max的输出速度远超竞争对手,推动了多媒体创作的可能性边界。
2025-02-18 20:39:29
902
原创 M4 Ultra Mac Studio上的DeepSeek:性能突破
M4 Ultra Mac Studio有望通过结合卓越的性能、能效和紧凑的设计,重新定义计算性能的格局。凭借其创新能力,这台机器预计将与Nvidia的高端GPU(如RTX 590)相抗衡,同时为运行本地语言模型(LLMs)如DeepSeek设定新的基准。这一发展可能标志着行业的一个关键时刻,提供了性能与实用性的平衡,吸引了专业人士和爱好者。下面来自Max Tech的视频为我们提供了更多关于DeepSeek在新Mac Studio上预期表现的细节。
2025-02-18 20:38:08
1022
原创 OpenAI 深度研究与 Gemini 深度研究:哪个更好?
在理解和生成基于海量数据集的人类文本方面表现出色,推动了聊天机器人、内容生成和问答系统等应用。指的是 OpenAI 为开发和增强其 AI 模型套件而进行的持续深入研究工作,包括著名的。方面,OpenAI 和 Gemini AI 提供了不同的方法、能力和目标。,无论您是在寻找内容生成的实际解决方案,还是在寻找更先进的现实世界应用系统。虽然这两个组织都是 AI 的先驱,但它们的关注领域和目标有显著不同。根据您的具体需求,这两种工具各有其优势。,分析它们的特性、优势,以及根据您的需求,哪个可能是更好的选择。
2025-02-18 20:30:03
1069
原创 OpenAI o3-mini 与 DeepSeek R1:性能比较与初步印象
如果您有兴趣了解本周末最新发布的 OpenAI o3-mini AI 模型,这份由 All About AI 提供的性能比较和初步印象概述将希望能解答您的初步疑问。无论您是开发者、研究人员,还是对最新 AI 技术感到好奇的人,选择模型可能会让人感到不知所措。这就是 OpenAI o3-mini 与 DeepSeek R1 的作用,这两个最近的竞争者各具独特优势和特点,争夺编码、推理和协调的顶尖地位。但您如何决定哪个更适合您呢?答案在于理解它们在现实场景中的表现。
2025-02-18 20:28:10
574
原创 OpenAI o3-mini 与 DeepSeek R1:AI 编程比较
OpenAI 的 o3-mini 和 DeepSeek R1 都是强大的语言模型,各自在特定领域表现出色。最适合需要大上下文窗口、快速响应时间和强大逻辑推理能力的任务。在编码任务、细致推理、提示敏感性和详细思维链分析方面表现出色。理想的选择取决于你的独特需求和优先事项。在你的具体任务上测试这两个模型可以提供所需的清晰度,以确定哪个更符合你的目标和期望。
2025-02-18 20:26:31
827
原创 OpenAI-o3-mini 与 DeepSeek R1:先进 AI 推理模型的完整比较
OpenAI 的 o3‑mini 于 2025 年初推出,作为公司持续努力提供高效和准确推理模型的一部分。它通过ChatGPT接口向免费用户(有使用限制)和高级订阅用户(Plus、Team 和 Pro)提供。其主要目的是快速准确地处理需要逻辑推理、编码和STEM问题解决的任务。*o3‑mini 的主要特点**高级推理:*o3‑mini 旨在逐步“思考”,使其能够在给出答案之前将复杂问题分解为更小的部分。*快速响应时间:*基准测试表明,o3‑mini 在编码和数学问题等任务中能在几秒钟内提供答案。
2025-02-18 20:25:16
1364
原创 Perplexity 添加 DeepSeek R1 搜索选项,配合 AI 推理:谷歌的竞争对手来了
Perplexity,这一创新搜索引擎,通过整合新的 DeepSeek R1 推理模型,为其专业版引入了一项重要升级。这一整合增强了平台处理和响应复杂查询的能力,将先进的搜索功能与 AI 驱动的推理相结合,以提供结构化、深入的见解。作为一项高级功能,专业版专为需要超越基本搜索能力的专业人士设计,如研究人员、决策者和问题解决者。你是否曾经在搜索引擎前感到无助,对复杂问题的模糊或不完整答案感到沮丧?
2025-02-18 20:22:04
906
原创 Qwen2.5-Max:阿里巴巴的新AI模型超越DeepSeek、GPT-4o和Claude Sonnet
在Arena-Hard、LiveBench、LiveCodeBench和GPQA-Diamond等基准测试中显著超越DeepSeek V3,同时在MMLU-Pro等其他评估中也表现出竞争力。在预训练之后,该模型通过监督微调(SFT)和人类反馈的强化学习(RLHF)进行了微调,进一步增强了其能力。其在多个基准测试中的卓越表现及其多样化的能力使其成为各种应用的重要工具。在快速发展的人工智能领域,一位新的竞争者出现了,打破了竞争格局。:该模型可以进行实时搜索,收集数据并总结发现,使其成为研究和分析的强大工具。
2025-02-18 20:20:13
921
原创 100个DeepSeek AI prompt提示词:实用案例与示例
Deepseek,这款 AI 助手,最近获得了巨大的关注和人气。通过精心设计的提示来引导 AI,可以增强 AI 的交互体验。这些更好的提示在生成相关和有见地的响应中发挥着至关重要的作用,作为对话的起点,影响 AI 输出的质量和方向,使交互更加有效和引人入胜。提示工程师的角色在创建这些有效提示时变得越来越重要,尤其是在生成式 AI 技术中。本综合指南提供了 100 个高效的 DeepSeek 提示,这些提示经过广泛的 AI 行业经验精心策划。
2025-02-18 20:18:07
989
CSV乱码解决:CSV转UTF-8 BOM格式转换工具(不用打开csv,速度更快)
2025-03-13
Manus开源免费满血版-OpenManus
2025-03-07
Python性能分析中SCALENE优化的研究:DeepSeek-R1与LLaMA推进开源AI集成的应用与成效
2025-02-20
基于知识图谱和DeepSeek-R1与Weaviate集成的生物医学聊天机器人解决方案
2025-02-20
混合可调专家模型(MoTE):通过操控特定专家调控DeepSeek-R1的推理行为及语言转换
2025-02-20
深度解析推理模型在链式思维忠实度测试中的表现与改进
2025-02-20
大型语言模型DeepSeek-R1中强化学习与监督微调在AI安全性方面的对比与优化
2025-02-20
在Amazon Bedrock部署DeepSeek R1模型的技术指南与应用实例
2025-02-20
基于RTX3090/RTX4090 GPU本地部署Deepseek-R1模型(含qwen-7B与llama-8B蒸馏)
2025-02-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人