- 博客(5)
- 资源 (1)
- 收藏
- 关注
原创 Chatglm2-6B学习笔记1
Chatglm2-6B是Chatglm-6B的二代对话模型,除了拥有第一代对话流畅、部署门槛低的特性之外,还有以下几个优点:1.更强大的性能,在各个测评集上均有较大幅度的提升。2.可以接受更长的上下文,基座模型由chatglm-6b的2k提升至了32k,并在训练的过程中采用的是8k的对话上下文。3.更高效的推理,将Multi-Head Attention替换成了Multi-Query Attention,降低了显存占用,且加快了推理的速度。4.协议更加的开放,在取得许可的情况下,可进行商用。
2023-07-10 13:33:59
507
1
原创 函数的极限
一 函数1.1 函数是一种对应关系、一种对应法则、映射。给定一个数集根据这种对应关系映射到另外一种数集。一个函数有三个不可缺少的元素:自变量、因变量、映射关系。其中自变量的范围称为自定域,因变量的范围称为值域。值得注意的是:一个x值有且只有一个y相对应,否则不能称为函数。1.2 函数的几种特性a)有界性:若整个函数的所有y值的绝对值小于或等于一个数值就称为这个函数是有界的。那y=sin(x)...
2019-03-20 11:14:58
2661
1
原创 归并排序详解merge sort python代码实现
归并排序中采用的分而治之(divide-and-conquer)的思想. 把大问题(原问题)拆成一个一个相似的小问题,然后对这些小问题采用相同的方法进行处理,再最后合并各个小问题的答案,最后就得到了原问题的答案。在讲怎么把原问题分解成一个一个小问题之前,我们需要一个合并函数来将两个无序的序列合并成一个有序的序列1 现在我们手里有三个序列, 一个是未排序的序列A: [19, 21, 3, 1, ...
2019-02-28 08:17:43
1007
原创 选择排序
算法原理假如我有一个序列[23, 7, 3, 50, 4, 26, 1], 首先我在这个序列中寻找最小的元素,然后找到了最小的元素是1。然后我就将这个最小的元素和这个序列第一个元素23进行交换,现在就得到了这个新序列[1, 7, 3, 50, 4, 26, 23]. 这个序列被分成了两部分,一部分是1这个已经排好序的子序列,另外一个是没有排好序的子序列 7, 3, 50, 4, 26, 23...
2019-02-25 07:32:42
244
3
原创 插入排序 insertion sort
一. 原理现在想象一下手里有五张牌:现在对这几张进行排序,最后在手里我们希望得到顺序是从小到大increasing这样的五张牌:插入排序的过程:现在一个一个的将这些红桃牌提取出来比较再将他们插入正确的位置。首先将红桃2提取出来当作一个子序列,现在这个子序列已经是排好序的了,因为它只包含红桃2一个元素。原来的序列已经被分成了两部分,一部分是已经排好序的(红桃2),另一部分是没有进行...
2019-02-25 07:08:21
298
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅