自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(57)
  • 收藏
  • 关注

原创 训练出一个模型需要哪些步骤

训练一个大模型(如LLM)是一个系统化工程,涉及数据、算法、算力和工程优化的复杂协作。掌握这些步骤后,可根据实际需求调整流程。

2025-04-03 17:24:57 407

原创 大模型中的参数规模与显卡匹配

在大模型训练和推理中,显卡(GPU/TPU)的选择与模型参数量紧密相关,需综合考虑显存、计算能力和成本。70B模型原始显存需求(FP16):140GB →。*基于AWS p4d.24xlarge实例估算。→ 需多卡分布式训练。实际部署前,建议使用。

2025-04-03 17:23:05 595

原创 大模型训练必须使用英伟达的显卡吗

大模型训练并非必须使用英伟达(NVIDIA)显卡,但英伟达GPU因其成熟的生态和工具链目前仍是主流选择。随着AI芯片竞争加剧,未来3-5年可能会出现更成熟的替代方案,但目前训练百亿级大模型仍建议优先考虑英伟达硬件。

2025-04-03 17:21:30 293

原创 大模型的参数规模

在大模型(如LLM、多模态模型)的讨论中,= 各层参数量累加,最终以。

2025-04-02 15:20:18 973

原创 Mistral模型

Mistral 是由法国初创公司 Mistral AI 开发的一系列高效开源大语言模型(LLM),以其小体积、高性能著称,尤其在7B(70亿参数)规模下表现优异,甚至超越部分更大的模型(如Llama 2 13B)。以下是关键细节:优势总结:(2)本地量化运行(llama.cpp + GGUF)下载GGUF模型(如Mistral-7B-v0.1-Q4_K_M.gguf)。使用llama.cpp运行:(3)微调(LoRA/PEFT)支持Hugging Face生态的微调工具:5. Mistr

2025-04-02 13:55:36 458

原创 模大型格式

是一种专为**本地运行大型语言模型(LLMs)**设计的二进制文件格式,由。它优化了模型加载、内存管理和跨平台兼容性,特别适合在。团队开发,用于替代早期的。设备上高效运行量化模型。GGUF 文件通常以。

2025-04-02 13:50:28 675

原创 vLLM、 llama-box 和 vox-box

以下是关于和。

2025-04-02 11:25:30 415

原创 Python 学习路线指南

记住,学习编程最重要的是坚持和实践,祝你学习顺利!

2025-03-31 09:23:00 596

原创 大模型介绍

其发布的模型包括DeepSeek LLM、DeepSeek - V3、DeepSeek - R1等,具有强大的语言理解和生成能力,可进行高质量的文本分析、翻译、摘要生成等任务,还能根据给定的主题、风格和要求,快速生成高质量文案。例如,DeepSeek - V3是一个混合专家模型(MoE),有6710亿参数,通过不同的训练方式可得到具有不同能力的模型,如聊天模型经过额外的指令调整和人类反馈强化学习,在编码和数学等任务上表现出色。DeepSeek属于大语言模型(LLM)这一类别。

2025-03-29 11:04:36 796

原创 AI 强化学习

在预训练语言模型(PLM)的基础上,使用高质量的标注数据(输入-输出对)进行有监督的微调,使模型适应特定任务。通过人类对模型输出的排序或评分训练奖励模型(RM),再用强化学习(如PPO)优化策略模型,使其符合人类偏好。用AI模型(如大语言模型)替代人类标注反馈,自动化偏好对齐流程。绕过显式奖励建模,直接利用偏好数据优化策略模型,将RLHF问题转化为分类任务。选择技术需权衡数据、计算资源和对齐目标。随着LLM发展,自动化、低成本的偏好对齐(如RLAIF、DPO)将成为主流方向。

2025-03-29 11:01:30 495

原创 余生,先悦己,后悦人

杨绛在《一百岁感言》中说:“。”诚然,没有谁的生活是容易的,处境越是艰难,内心越要绚烂,取悦自己,也温暖世界。把心情照顾好,比什么都重要。真正的智者,既懂得取悦自己,也不忘取悦他人,将人生过得美好而辽阔。

2023-10-31 14:13:06 185

原创 spring-boot

spring-boot 学习

2023-10-26 14:41:34 729

原创 JAVA基础

这些表可以使用SELECT语句查询,也可以使用SQL语句更新performance_schema数据库中的表记录(如动态修改performance_schema的setup_*开头的几个配置表,但要注意:配置表的更改会立即生效,这会影响数据收集)(也可以通过SQL语句来控制那些事件被收集)。d、performance_schema中的事件只记录在本地server的performance_schema中,其下的这些表中数据发生变化时不会被写入binlog中,也不会通过复制机制被复制到其他server中。

2023-10-26 14:38:36 163

原创 大数据平台开发经验

十年大数据经验、大数据开发技术栈

2023-10-19 15:50:56 496

原创 Redis基础

这里很好理解,把RDB理解为一整个表全量的数据,AOF理解为每次操作的日志就好了,服务器重启的时候先把表的数据全部搞进去,但是他可能不完整,你再回放一下日志,数据不就完整了嘛。传统的关系型数据库如Mysql已经不能适用所有的场景了,比如秒杀的库存扣减,APP首页的访问流量高峰等等,都很容易把数据库打崩,所以引入了缓存中间件,目前市面上比较常用的缓存中间件有 Redis 和 Memcached 不过中和考虑了他们的优缺点,最后选择了Redis。这时候你要给予惊讶的反馈:唉,是喔,这个锁就永远得不到释放了。

2023-10-19 11:06:34 102

原创 播放解码总结

1、分段2、格式3、解码4、播放。

2023-04-23 09:53:38 133

原创 monorepo、lerna

Lerna是一个用来优化托管在 git\npm 上的多 package 代码库的工作流的一个管理工具,可以让你在主项目下管理多个子项目,从而解决了多个包互相依赖,且发布时需要手动维护多个包的问题。一个项目依赖了多个 npm 包,当某一个子 npm 包代码修改升级时,都要对主干项目包进行升级修改。Monorepo 是管理项目代码的一个方式,指在一个项目仓库 (repo) 中管理多个模块/包 (package),不同于常见的每个模块建一个 repo。1.节约了大量存储空间。

2023-04-17 15:16:01 735

原创 AST理解

AST用途

2023-04-13 10:49:30 112

原创 产品开发流程规范

流程

2023-04-11 17:14:15 122

原创 find、filter、findIndex、indexOf、map、forEach、reduce区分

find返回的是只能使用,不能用于find()方法,用于找出第一个符合条件的数组成员。它的参数是一个回调函数,所有数组成员依次执行该回调函数,直到找出第一个返回值为true的成员,然后返回该成员。如果没有符合条件的成员,则返回undefined。

2023-04-11 15:37:59 1503

原创 了解package.json和package-lock.json

package.json 、package-lock.json、依赖包

2022-11-20 07:45:43 883

原创 node-sass和node版本兼容

node-sass对node版本的要求

2022-11-16 14:08:43 296

原创 css你要知道的基础

css 基本框架与介绍

2022-11-07 14:34:59 259

原创 react的学习中

react hook 、 router

2022-11-07 14:13:08 350

原创 vue3深入了解

vue3

2022-09-21 07:02:57 602

原创 Babel深入学习

babel 用法、 介绍

2022-09-20 15:25:10 356

原创 typescript答疑

关于typescript的常见问题总结,

2022-09-20 14:20:32 252

原创 认识大数据

大数据基础,了解大数据

2022-09-20 14:15:00 1856

原创 dom的typescript类型定义

typescript、dom 、ts、type如何定义dom

2022-07-16 23:17:07 1927

原创 tsconfig.json

typescript、tsconfig、tsconfig.json使用说明

2022-07-09 22:12:19 697

原创 前端实现所有的跨域方式

前端跨域、如何跨域、跨域的几种方式

2022-07-08 07:02:10 185

原创 mongodb

nodejs框架、mongodb数据库

2022-07-08 06:56:22 130

原创 mysql

nodejs框架、mysql数据库

2022-07-08 06:55:04 117

原创 koa框架

nodejs框架、主要用法

2022-07-08 06:54:11 162

原创 express框架

nodejs框架、主要用法

2022-07-08 06:53:14 122

原创 jwt协议

介绍各种协议

2022-07-04 08:51:14 330

原创 nodejs

nodejs、用法、框架

2022-07-03 13:44:58 1816

原创 为什么读书,读书的好处

读书、总结

2022-04-24 06:45:26 163

原创 axios的post方式在url上传参

![在这里插入图片描述](https://img-blog.csdnimg.cn/5bd98fb0d9d04ac3a7c818bf4ecbce1d.png#pic_center[外链图片转存失败,源站可能有防盗在这里插入!链机制,建描述]议将图片上https://传(imblog.csdtg.cn/KmZv7fe23545433a499b58ef396032d0.png#pic_center986)(https://img-paramsKtUKKmZv-1637653609786)][外链图片转存.

2021-11-23 15:50:09 871

原创 ECMAScript的里程碑

起源 1996 年 11月前情回顾:Ecma国际Ecma国际(Ecma International)是一家国际性会员制度的信息和电信标准组织。1994年之前,名为欧洲计算机制造商协会(European Computer Manufacturers Association)。因为计算机的国际化,组织的标准牵涉到很多其他国家,因此组织决定改名表明其国际性。现名称已不属于首字母缩略字。NetscapeNetscape(网景)公司,是一个自1994年开始的品牌。它亦是网景通讯公司(Netscape Com

2021-04-26 15:12:25 255

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除