- 博客(57)
- 收藏
- 关注
原创 训练出一个模型需要哪些步骤
训练一个大模型(如LLM)是一个系统化工程,涉及数据、算法、算力和工程优化的复杂协作。掌握这些步骤后,可根据实际需求调整流程。
2025-04-03 17:24:57
407
原创 大模型中的参数规模与显卡匹配
在大模型训练和推理中,显卡(GPU/TPU)的选择与模型参数量紧密相关,需综合考虑显存、计算能力和成本。70B模型原始显存需求(FP16):140GB →。*基于AWS p4d.24xlarge实例估算。→ 需多卡分布式训练。实际部署前,建议使用。
2025-04-03 17:23:05
595
原创 大模型训练必须使用英伟达的显卡吗
大模型训练并非必须使用英伟达(NVIDIA)显卡,但英伟达GPU因其成熟的生态和工具链目前仍是主流选择。随着AI芯片竞争加剧,未来3-5年可能会出现更成熟的替代方案,但目前训练百亿级大模型仍建议优先考虑英伟达硬件。
2025-04-03 17:21:30
293
原创 Mistral模型
Mistral 是由法国初创公司 Mistral AI 开发的一系列高效开源大语言模型(LLM),以其小体积、高性能著称,尤其在7B(70亿参数)规模下表现优异,甚至超越部分更大的模型(如Llama 2 13B)。以下是关键细节:优势总结:(2)本地量化运行(llama.cpp + GGUF)下载GGUF模型(如Mistral-7B-v0.1-Q4_K_M.gguf)。使用llama.cpp运行:(3)微调(LoRA/PEFT)支持Hugging Face生态的微调工具:5. Mistr
2025-04-02 13:55:36
458
原创 模大型格式
是一种专为**本地运行大型语言模型(LLMs)**设计的二进制文件格式,由。它优化了模型加载、内存管理和跨平台兼容性,特别适合在。团队开发,用于替代早期的。设备上高效运行量化模型。GGUF 文件通常以。
2025-04-02 13:50:28
675
原创 大模型介绍
其发布的模型包括DeepSeek LLM、DeepSeek - V3、DeepSeek - R1等,具有强大的语言理解和生成能力,可进行高质量的文本分析、翻译、摘要生成等任务,还能根据给定的主题、风格和要求,快速生成高质量文案。例如,DeepSeek - V3是一个混合专家模型(MoE),有6710亿参数,通过不同的训练方式可得到具有不同能力的模型,如聊天模型经过额外的指令调整和人类反馈强化学习,在编码和数学等任务上表现出色。DeepSeek属于大语言模型(LLM)这一类别。
2025-03-29 11:04:36
796
原创 AI 强化学习
在预训练语言模型(PLM)的基础上,使用高质量的标注数据(输入-输出对)进行有监督的微调,使模型适应特定任务。通过人类对模型输出的排序或评分训练奖励模型(RM),再用强化学习(如PPO)优化策略模型,使其符合人类偏好。用AI模型(如大语言模型)替代人类标注反馈,自动化偏好对齐流程。绕过显式奖励建模,直接利用偏好数据优化策略模型,将RLHF问题转化为分类任务。选择技术需权衡数据、计算资源和对齐目标。随着LLM发展,自动化、低成本的偏好对齐(如RLAIF、DPO)将成为主流方向。
2025-03-29 11:01:30
495
原创 余生,先悦己,后悦人
杨绛在《一百岁感言》中说:“。”诚然,没有谁的生活是容易的,处境越是艰难,内心越要绚烂,取悦自己,也温暖世界。把心情照顾好,比什么都重要。真正的智者,既懂得取悦自己,也不忘取悦他人,将人生过得美好而辽阔。
2023-10-31 14:13:06
185
原创 JAVA基础
这些表可以使用SELECT语句查询,也可以使用SQL语句更新performance_schema数据库中的表记录(如动态修改performance_schema的setup_*开头的几个配置表,但要注意:配置表的更改会立即生效,这会影响数据收集)(也可以通过SQL语句来控制那些事件被收集)。d、performance_schema中的事件只记录在本地server的performance_schema中,其下的这些表中数据发生变化时不会被写入binlog中,也不会通过复制机制被复制到其他server中。
2023-10-26 14:38:36
163
原创 Redis基础
这里很好理解,把RDB理解为一整个表全量的数据,AOF理解为每次操作的日志就好了,服务器重启的时候先把表的数据全部搞进去,但是他可能不完整,你再回放一下日志,数据不就完整了嘛。传统的关系型数据库如Mysql已经不能适用所有的场景了,比如秒杀的库存扣减,APP首页的访问流量高峰等等,都很容易把数据库打崩,所以引入了缓存中间件,目前市面上比较常用的缓存中间件有 Redis 和 Memcached 不过中和考虑了他们的优缺点,最后选择了Redis。这时候你要给予惊讶的反馈:唉,是喔,这个锁就永远得不到释放了。
2023-10-19 11:06:34
102
原创 monorepo、lerna
Lerna是一个用来优化托管在 git\npm 上的多 package 代码库的工作流的一个管理工具,可以让你在主项目下管理多个子项目,从而解决了多个包互相依赖,且发布时需要手动维护多个包的问题。一个项目依赖了多个 npm 包,当某一个子 npm 包代码修改升级时,都要对主干项目包进行升级修改。Monorepo 是管理项目代码的一个方式,指在一个项目仓库 (repo) 中管理多个模块/包 (package),不同于常见的每个模块建一个 repo。1.节约了大量存储空间。
2023-04-17 15:16:01
735
原创 find、filter、findIndex、indexOf、map、forEach、reduce区分
find返回的是只能使用,不能用于find()方法,用于找出第一个符合条件的数组成员。它的参数是一个回调函数,所有数组成员依次执行该回调函数,直到找出第一个返回值为true的成员,然后返回该成员。如果没有符合条件的成员,则返回undefined。
2023-04-11 15:37:59
1503
原创 axios的post方式在url上传参
(https://img-paramsKtUKKmZv-1637653609786)][外链图片转存.
2021-11-23 15:50:09
871
原创 ECMAScript的里程碑
起源 1996 年 11月前情回顾:Ecma国际Ecma国际(Ecma International)是一家国际性会员制度的信息和电信标准组织。1994年之前,名为欧洲计算机制造商协会(European Computer Manufacturers Association)。因为计算机的国际化,组织的标准牵涉到很多其他国家,因此组织决定改名表明其国际性。现名称已不属于首字母缩略字。NetscapeNetscape(网景)公司,是一个自1994年开始的品牌。它亦是网景通讯公司(Netscape Com
2021-04-26 15:12:25
255
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人