Day01 - 引言

参考链接:so-large-lm/docs/content/ch01.md at main · datawhalechina/so-large-lm

引言

1.1语言模型

给定文本输入,给出对应的新的文本或者符号输出

自回归语言模型

特点:可以利用前馈神经网络计算每个条件概率分布

temperature:可以用来控制生成中的变异量

较高的temperature代表更高的多样性,较低代表更高质量用好语言模型:temperature、top-p等核心参数解析_程序员_Baihai IDP_InfoQ写作社区
token条件概率计算公式如下:
在这里插入图片描述
退火条件概率分布:随着T的设置按照比例将概率分布加和为1

1.2 大模型相关历史回顾

1.2.1 熵,N-gram

在这里插入图片描述

熵的值越小,序列结构性越强,编码长度越短,log1/p(x)可以代表x的编码长度

N-gram:预测字符x只依靠前n-1个字符(计算效率高,但统计效率低下,难以捕捉长时间依赖)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值