自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 HTTP 响应状态码及其含义

这些状态码表示临时响应,通常是为了告知客户端应该采取什么行动。这些状态码表示客户端需要执行进一步的操作以完成请求。这些状态码表示服务器在尝试处理请求时发生了错误。这些状态码表示请求包含语法错误或无法完成请求。这些状态码表示请求已被成功接收、理解和处理。

2024-12-12 13:33:59 368

原创 P-tuning V1、P-tuning V2、 Prompt Tuning和 Prefix Tuning的差异

训练:在训练过程中,仅更新虚拟Token的嵌入和Prompt Encoder的参数,而预训练模型的其他参数保持不变。多层提示:在某些变体中,P-tuning V2 可以在模型的每一层前面插入虚拟Token,以增强模型的表达能力。提示:在输入序列中插入固定格式的提示,提示中的某些部分(如虚拟Token)是可学习的。训练:在训练过程中,仅更新虚拟Token的嵌入,而预训练模型的其他参数保持不变。训练:在训练过程中,仅更新提示中的可学习部分,而预训练模型的其他参数保持不变。缺点:提示的设计需要一定的经验和技巧。

2024-11-21 21:37:10 609 1

原创 Prefix-tuning

核心概念: 前缀序列:一个可训练的序列,插入到输入序列的前面,用于引导模型生成特定任务的输出。 参数冻结:在微调过程中,预训练模型的参数保持不变,只训练前缀序列的参数。 任务特定:前缀序列可以根据不同的任务进行训练,使得模型能够适应多种任务。工作原理: 1.前缀序列的插入: 在输入序列之前插入一个可训练的前缀序列。这个前缀序列可以看作是任务特定的提示,用于引导模型生成特定任务的输出。前缀序列的长度通常较短,例如几十

2024-11-21 20:48:58 393

原创 Adapter

Adapter方法不需要微调预训练模型的全部参数,通过引入少量针对特定任务的参数,来存储有关该任务的知识,降低对模型微调的算力要求。在预训练模型每一层(或某些层)中添加Adapter模块(如上图左侧结构所示),微调时冻结预训练模型主体,由Adapter模块学习特定下游任务的知识。:将预训练模型参数与特定于任务的Adapter参数固定,引入新参数学习组合多个Adapter中的知识,提高模型在目标任务中的表现。:训练Adapter模块学习下游任务的特定知识,将知识封装在Adapter模块参数中。

2024-11-21 17:39:14 965

原创 343. 整数拆分

,并使这些整数的乘积最大化。你可以获得的最大乘积。

2024-07-28 21:00:39 175

原创 63. 不同路径 II

机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角(在下图中标记为 “Finish”)。现在考虑网格中有障碍物。那么从左上角到右下角将会有多少条不同的路径?网格的左上角 (起始点在下图中标记为 “Start” )。1. 向右 -> 向右 -> 向下 -> 向下。2. 向下 -> 向下 -> 向右 -> 向右。3x3 网格的正中间有一个障碍物。网格中的障碍物和空位置分别用。从左上角到右下角一共有。

2024-07-28 19:30:07 175

原创 62. 不同路径

备注2:计算时,当前位置(i,j)的数据只和当前行的第j-1个数据和前一行的第j个数据有关,所以当计算当前行的第j个数据时,可以直接把上一行的第j个数据覆盖,不影响计算结果(即用第i行的数据逐渐覆盖第i-1行,不影响计算结果)。机器人试图达到网格的右下角(在下图中标记为 “Finish” )。备注1:可以理解为直接在一维数组上面更新数据,原来是新的数据存储在下一行的数组里。1. 向右 -> 向下 -> 向下。2. 向下 -> 向下 -> 向右。3. 向下 -> 向右 -> 向下。问总共有多少条不同的路径?

2024-07-28 19:10:06 245

原创 746. 使用最小花费爬楼梯

一旦你支付此费用,即可选择向上爬一个或者两个台阶。- 支付 1 ,向上爬两个台阶,到达下标为 2 的台阶。- 支付 1 ,向上爬两个台阶,到达下标为 4 的台阶。- 支付 1 ,向上爬两个台阶,到达下标为 6 的台阶。- 支付 1 ,向上爬一个台阶,到达下标为 7 的台阶。- 支付 1 ,向上爬两个台阶,到达下标为 9 的台阶。- 支付 15 ,向上爬两个台阶,到达楼梯顶部。- 支付 1 ,向上爬一个台阶,到达楼梯顶部。你将从下标为 1 的台阶开始。你将从下标为 0 的台阶开始。

2024-07-27 22:16:06 328

原创 70. 爬楼梯

你有多少种不同的方法可以爬到楼顶呢?1. 1 阶 + 1 阶 + 1 阶。有两种方法可以爬到楼顶。1. 1 阶 + 1 阶。有三种方法可以爬到楼顶。2. 1 阶 + 2 阶。3. 2 阶 + 1 阶。

2024-07-27 21:49:48 165

原创 126. 斐波那契数

答案需要取模 1e9+7(1000000007) ,如计算初始结果为:1000000008,请返回 1。F(n) = F(n - 1) + F(n - 2),其中 n > 1。开始,后面的每一项数字都是前面两项数字的和。表示)形成的序列称为。

2024-07-27 21:32:28 206

原创 300. 最长递增子序列

*子序列** 是由数组派生而来的序列,删除(或不删除)数组中的元素而不改变其余元素的顺序。例如[3,6,2,7] 是数组 [0,3,1,6,2,2,7] 的子序列。(该链接为二分查找的原理解析,主要针对不熟悉二分查找的同学,并不是以下代码的原理解析)解释:最长递增子序列是 [2,3,7,101],因此长度为 4。输入:nums = [10,9,2,5,3,7,101,18]输入:nums = [7,7,7,7,7,7,7]输入:nums = [0,1,0,3,2,3]

2024-07-25 23:20:19 288

原创 1143. 最长公共子序列

是指这样一个新的字符串:它是由原字符串在不改变字符的相对顺序的情况下删除某些字符(也可以不删除任何字符)后组成的新字符串。最长公共子序列是 "ace" ,它的长度为 3。最长公共子序列是 "abc" ,它的长度为 3。两个字符串没有公共子序列,返回 0。是这两个字符串所共同拥有的子序列。,返回这两个字符串的最长。

2024-07-24 22:57:16 836

原创 718.最长重复子数组

给两个整数数组 nums1 和 nums2 ,返回 两个数组中 公共的 、长度最长的子数组的长度。输入:nums1 = [1,2,3,2,1], nums2 = [3,2,1,4,7]输入:nums1 = [0,0,0,0,0], nums2 = [0,0,0,0,0]解释:长度最长的公共子数组是 [3,2,1]。

2024-07-22 23:13:45 207 1

原创 【无标题】

笔记-1.线性代数标量、向量、矩阵和张量标量一个标量就是一个单独的数,通常用斜体表示标量向量一个向量就是一列数,这些数是有序排列的,通过次序中的索引,可以确定每个单独的数,通常用粗体的小写变量表示向量矩阵矩阵是一个二维数组,其中的一个元素由两个索引所确定,通常用大写的粗体表示张量一个数组中的元素分布在若干维坐标的规则网格中,或者看([https://www.zhihu.com/question/23720923])...

2021-11-23 14:55:46 464

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除