三思而后行，慎承诺-优快云博客

原创训练出一个模型需要哪些步骤

训练一个大模型（如LLM）是一个系统化工程，涉及数据、算法、算力和工程优化的复杂协作。掌握这些步骤后，可根据实际需求调整流程。

2025-04-03 17:24:57 407

原创大模型中的参数规模与显卡匹配

在大模型训练和推理中，显卡（GPU/TPU）的选择与模型参数量紧密相关，需综合考虑显存、计算能力和成本。70B模型原始显存需求（FP16）：140GB →。*基于AWS p4d.24xlarge实例估算。→ 需多卡分布式训练。实际部署前，建议使用。

2025-04-03 17:23:05 595

原创大模型训练必须使用英伟达的显卡吗

大模型训练并非必须使用英伟达（NVIDIA）显卡，但英伟达GPU因其成熟的生态和工具链目前仍是主流选择。随着AI芯片竞争加剧，未来3-5年可能会出现更成熟的替代方案，但目前训练百亿级大模型仍建议优先考虑英伟达硬件。

2025-04-03 17:21:30 293

原创大模型的参数规模

在大模型（如LLM、多模态模型）的讨论中，= 各层参数量累加，最终以。

2025-04-02 15:20:18 973

Mistral 是由法国初创公司 Mistral AI 开发的一系列高效开源大语言模型（LLM），以其小体积、高性能著称，尤其在7B（70亿参数）规模下表现优异，甚至超越部分更大的模型（如Llama 2 13B）。以下是关键细节：优势总结：（2）本地量化运行（llama.cpp + GGUF）下载GGUF模型（如Mistral-7B-v0.1-Q4_K_M.gguf）。使用llama.cpp运行：（3）微调（LoRA/PEFT）支持Hugging Face生态的微调工具：5. Mistr

2025-04-02 13:55:36 458

原创模大型格式

是一种专为**本地运行大型语言模型（LLMs）**设计的二进制文件格式，由。它优化了模型加载、内存管理和跨平台兼容性，特别适合在。团队开发，用于替代早期的。设备上高效运行量化模型。GGUF 文件通常以。

2025-04-02 13:50:28 675

原创 vLLM、 llama-box 和 vox-box

以下是关于和。

2025-04-02 11:25:30 415

原创 Python 学习路线指南

记住，学习编程最重要的是坚持和实践，祝你学习顺利！

2025-03-31 09:23:00 596

原创大模型介绍

其发布的模型包括DeepSeek LLM、DeepSeek - V3、DeepSeek - R1等，具有强大的语言理解和生成能力，可进行高质量的文本分析、翻译、摘要生成等任务，还能根据给定的主题、风格和要求，快速生成高质量文案。例如，DeepSeek - V3是一个混合专家模型（MoE），有6710亿参数，通过不同的训练方式可得到具有不同能力的模型，如聊天模型经过额外的指令调整和人类反馈强化学习，在编码和数学等任务上表现出色。DeepSeek属于大语言模型（LLM）这一类别。

2025-03-29 11:04:36 796

原创 AI 强化学习

在预训练语言模型（PLM）的基础上，使用高质量的标注数据（输入-输出对）进行有监督的微调，使模型适应特定任务。通过人类对模型输出的排序或评分训练奖励模型（RM），再用强化学习（如PPO）优化策略模型，使其符合人类偏好。用AI模型（如大语言模型）替代人类标注反馈，自动化偏好对齐流程。绕过显式奖励建模，直接利用偏好数据优化策略模型，将RLHF问题转化为分类任务。选择技术需权衡数据、计算资源和对齐目标。随着LLM发展，自动化、低成本的偏好对齐（如RLAIF、DPO）将成为主流方向。

2025-03-29 11:01:30 495

原创余生，先悦己，后悦人

杨绛在《一百岁感言》中说：“。”诚然，没有谁的生活是容易的，处境越是艰难，内心越要绚烂，取悦自己，也温暖世界。把心情照顾好，比什么都重要。真正的智者，既懂得取悦自己，也不忘取悦他人，将人生过得美好而辽阔。

2023-10-31 14:13:06 185

原创 spring-boot

spring-boot 学习

2023-10-26 14:41:34 729

原创 JAVA基础

这些表可以使用SELECT语句查询，也可以使用SQL语句更新performance_schema数据库中的表记录(如动态修改performance_schema的setup_*开头的几个配置表，但要注意：配置表的更改会立即生效，这会影响数据收集)（也可以通过SQL语句来控制那些事件被收集）。d、performance_schema中的事件只记录在本地server的performance_schema中，其下的这些表中数据发生变化时不会被写入binlog中，也不会通过复制机制被复制到其他server中。

2023-10-26 14:38:36 163

原创大数据平台开发经验

十年大数据经验、大数据开发技术栈

2023-10-19 15:50:56 496

原创 Redis基础

这里很好理解，把RDB理解为一整个表全量的数据，AOF理解为每次操作的日志就好了，服务器重启的时候先把表的数据全部搞进去，但是他可能不完整，你再回放一下日志，数据不就完整了嘛。传统的关系型数据库如Mysql已经不能适用所有的场景了，比如秒杀的库存扣减，APP首页的访问流量高峰等等，都很容易把数据库打崩，所以引入了缓存中间件，目前市面上比较常用的缓存中间件有 Redis 和 Memcached 不过中和考虑了他们的优缺点，最后选择了Redis。这时候你要给予惊讶的反馈：唉，是喔，这个锁就永远得不到释放了。

2023-10-19 11:06:34 102

原创播放解码总结

1、分段2、格式3、解码4、播放。

2023-04-23 09:53:38 133

原创 monorepo、lerna

Lerna是一个用来优化托管在 git\npm 上的多 package 代码库的工作流的一个管理工具,可以让你在主项目下管理多个子项目，从而解决了多个包互相依赖，且发布时需要手动维护多个包的问题。一个项目依赖了多个 npm 包，当某一个子 npm 包代码修改升级时，都要对主干项目包进行升级修改。Monorepo 是管理项目代码的一个方式，指在一个项目仓库 (repo) 中管理多个模块/包 (package)，不同于常见的每个模块建一个 repo。1.节约了大量存储空间。

2023-04-17 15:16:01 735

原创 AST理解

AST用途

2023-04-13 10:49:30 112

原创产品开发流程规范

流程

2023-04-11 17:14:15 122

原创 find、filter、findIndex、indexOf、map、forEach、reduce区分

find返回的是只能使用，不能用于find()方法，用于找出第一个符合条件的数组成员。它的参数是一个回调函数，所有数组成员依次执行该回调函数，直到找出第一个返回值为true的成员，然后返回该成员。如果没有符合条件的成员，则返回undefined。

2023-04-11 15:37:59 1503

原创了解package.json和package-lock.json

package.json 、package-lock.json、依赖包

2022-11-20 07:45:43 883

原创 node-sass和node版本兼容

node-sass对node版本的要求

2022-11-16 14:08:43 296

原创 css你要知道的基础

css 基本框架与介绍

2022-11-07 14:34:59 259

原创 react的学习中

react hook 、 router

2022-11-07 14:13:08 350

原创 vue3深入了解

2022-09-21 07:02:57 602

原创 Babel深入学习

babel 用法、介绍

2022-09-20 15:25:10 356

原创 typescript答疑

关于typescript的常见问题总结，

2022-09-20 14:20:32 252

原创认识大数据

大数据基础，了解大数据

2022-09-20 14:15:00 1856

原创 dom的typescript类型定义

typescript、dom 、ts、type如何定义dom

2022-07-16 23:17:07 1927

原创 tsconfig.json

typescript、tsconfig、tsconfig.json使用说明

2022-07-09 22:12:19 697

原创前端实现所有的跨域方式

前端跨域、如何跨域、跨域的几种方式

2022-07-08 07:02:10 185

原创 mongodb

nodejs框架、mongodb数据库

2022-07-08 06:56:22 130

原创 mysql

nodejs框架、mysql数据库

2022-07-08 06:55:04 117

原创 koa框架

nodejs框架、主要用法

2022-07-08 06:54:11 162

原创 express框架

nodejs框架、主要用法

2022-07-08 06:53:14 122

原创 jwt协议

介绍各种协议

2022-07-04 08:51:14 330

原创 nodejs

nodejs、用法、框架

2022-07-03 13:44:58 1816

原创为什么读书，读书的好处

读书、总结

2022-04-24 06:45:26 163

原创 axios的post方式在url上传参

![在这里插入图片描述](https://img-blog.csdnimg.cn/5bd98fb0d9d04ac3a7c818bf4ecbce1d.png#pic_center[外链图片转存失败,源站可能有防盗在这里插入!链机制,建描述]议将图片上https://传(imblog.csdtg.cn/KmZv7fe23545433a499b58ef396032d0.png#pic_center986)(https://img-paramsKtUKKmZv-1637653609786)][外链图片转存.

2021-11-23 15:50:09 871

原创 ECMAScript的里程碑

起源 1996 年 11月前情回顾：Ecma国际Ecma国际（Ecma International）是一家国际性会员制度的信息和电信标准组织。1994年之前，名为欧洲计算机制造商协会（European Computer Manufacturers Association）。因为计算机的国际化，组织的标准牵涉到很多其他国家，因此组织决定改名表明其国际性。现名称已不属于首字母缩略字。NetscapeNetscape(网景)公司，是一个自1994年开始的品牌。它亦是网景通讯公司（Netscape Com

2021-04-26 15:12:25 255

空空如也

空空如也