- 博客(3)
- 收藏
- 关注
转载 基于讯飞星辰Maas平台的模型微调-《甄嬛传》 的嬛嬛角色微调
是一个模型微调的零代码平台,旨在简化模型微调过程,无需一行代码即可定制大模型!2023年起,以ChatGPT为开端的AI原生应用开始走进生产场景,无论是日常对话、创作生成、还是解答专业问题,似乎“其底层是相关企业所训练出来的通用大模型,使用过这类工具的同学都能感觉到,现有的通用模型在一些专业化或个性化的任务上,往往并不够,比如:和。对于需要特定语言风格、情感表达和人物设定的任务,标准大模型往往难以做到精准模仿。在这种情况下,
2024-12-10 12:51:38
240
转载 AIGC基础通识讲解——图解,小白向
首先,明确指出并非所有的生成式AI都属于大语言模型范畴,例如图像扩散模型,虽然作为生成式AI的一种,其功能集中在生成图像而非文本内容,因此不属于大语言模型。每一步的输出取决于先前的隐藏状态和当前的输入,要等上一个步骤完成后才能进行当前的计算,因此无法并行计算,训练效率低,而且不擅长处理长序列,也就是长文本。然后数据通过多个隐藏层,每一层都会对数据进行一些复杂的数学运算,来帮助计算机理解图片中的特征,例如小猫的耳朵、眼睛等等,最后计算机会输出一个答案,表明这是否是一张小猫的图片。
2024-04-16 10:45:00
1722
3
转载 简述LLM的底层原理和演变
简述LLM的底层原理和演变,几分钟理解LLM: Large Language Model 大语言模型底层原理,明白模型书的发展。
2024-01-02 12:00:00
509
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人