- 博客(81)
- 问答 (1)
- 收藏
- 关注
原创 Cot+Finetune
展示了在 1.8K 个指令任务上微调各种语言模型,并在未见过的任务上进行评估的过程。既对带有范例(即零样本和少样本)的模型进行微调,也对不带范例的模型进行微调,同时还包括思维链的模型,从而实现模型在各种评估场景下的泛化能力。不同的模型规模有不同的批量大小和训练步骤,例如80M的模型使用64的批量大小和98k的训练步骤,而540B的模型使用32的批量大小和21k的训练步骤。对于不同规模的模型,学习率有不同的设置,例如80M的T5模型学习率为0.0005,而540B的PaLM模型学习率为0.001。
2025-03-08 09:05:05
605
原创 零样本思维链(Zero-shot CoT)
这篇文章研究了大型语言模型 (LLMs) 在推理任务上的能力,并提出了一种名为 Zero-shot-CoT 的新方法,该方法能够有效地引导 LLM 进行多步骤推理,并在各种推理任务上取得了显著的成果。文章发现,在标准零样本提示方法无法取得良好效果的情况下,简单的添加 “Let’s think step by step” 提示,就能够显著提升 LLM 在算术、符号推理以及其他逻辑推理任务上的表现。:通过添加触发句(如“Let’s think step by step”)让模型生成逐步的推理路径。
2025-03-01 18:02:29
997
原创 思维链 Chain-of-Thought Prompting
该方法通过示例展示多步推理过程,引导模型生成逻辑连贯的答案,显著提高了数学应用题(如GSM8K数据集)、常识推理和符号操作任务的性能。实验发现,仅方程式提示在GSM8K数据集上帮助不大,这表明GSM8K中的问题语义太复杂,无法直接翻译成方程式,而需要思维链中的自然语言推理步骤。实验发现,答案后的思维链提示与基线表现大致相同,这表明思维链中体现的顺序推理对于仅仅激活知识之外的原因是有用的。: 将传统提示中的答案(answer)替换为推理步骤(rationale)+ 答案,从而分解复杂问题为可解释的中间步骤。
2025-02-28 11:52:01
1100
原创 2024秋中间代码生成作业-B (满分25分)
(2)当前要求的输出只是为了便于评测,完成编译器中无需出现这些信息,请设计为方便打开/关闭这些输出的方案。(3)请自行设计三地址代码的内部存储形式,注意它并非一个简单的字符串,否则后续目标代码生成阶段会比较麻烦。对于使用 java 开发的编译器,(1)需按文法规则,用LR分析法法对文法中定义的语法成分进行分析(需要使用第1次作业中的词法分析程序);请在LR语法分析程序的基础上添加相应的语义动作,完成三地址代码的翻译。【特别提醒】(1)本次作业只考核对正确程序的处理,但需要为今后可能出现的错误情况预留接口。
2024-12-30 21:34:53
885
原创 2024秋语法分析作业-B(满分25分)
请根据该文法设计并实现LR语法分析程序,能基于上次作业的词法分析程序所识别出的单词,识别出各类语法成分。(2)当前要求的输出只是为了便于评测,完成编译器中无需出现这些信息,请设计为方便打开/关闭这些输出的方案。1)按词法分析识别单词的顺序,按行输出每个单词的信息(要求同词法分析作业,对于预读的情况不能输出)。2)在文法中出现的语法分析成分分析结束前,另起一行输出当前语法成分的名字,形如“”(1)需按文法规则,用LR分析法法对文法中定义的语法成分进行分析(需要使用上次作业中的词法分析程序);
2024-12-30 21:32:23
1123
原创 2024年秋词法分析作业(满分25分)
(4)单词的类别和单词值以及其他关注的信息,在词法分析阶段获取后,后续的分析阶段会使用,请注意记录;当前要求的输出只是为了便于评测,完成编译器中无需出现这些信息,请设计为方便打开/关闭这些输出的方案。【特别提醒】 (1)读取的字符串要原样保留着便于输出,特别是数字,这里输出的并不是真正的单词值,其实是读入的字符串,单词值需另行记录。(2)你的词法分析程序需要将注释去掉,注释有两种:单行注释和多行注释,风格与C语言相同。(3)在今后的错误处理作业中,需要输出错误的行号,在词法分析的时候注意记录该信息。
2024-12-30 21:29:29
940
原创 I. Reverse LIS The 7th China Collegiate Programming Contest, Finals (CCPC Finals 2021)
其中最优状态是经过诺干次操作后可以将字符串化成000(若干个0)11111(若干个1)对于一个区间记录4给状态vector[i][j] i,j属于{0,1}代表以i开头,以j结尾的子序列状态,vector记录操作几次的最优状态。对于两个vector[i][j] vector[x][y]我们可以先算出一段区间的最优解将两个区间合并。合并成 vector[i][y]写篇博客捋清一下思路。一些细节就参考代码吧。
2024-10-23 16:25:56
271
原创 ICPC-day2(圆方树)
每次询问两点x, y,求是否存在一个n的排列,使得第一个元素为x,最后一个元素为y,且排列的任意一个前缀、任意一个后缀都连通。可以用圆方树缩点将其变成一颗树,再判断这颗树是否是一条链,x,y是否在这条链的两侧。其实就是求这两个点是否存在两个不相同的路径,同时两者路径的交集是n。
2024-10-08 14:50:18
409
原创 神经网络字符分类
以下的代码判断就是定义一个简单的多层感知器,一共有三层,两个大小为100的隐层和一个大小为10的输出层,因为MNIST数据集是手写0到9的灰度图像,类别有10个,所以最后的输出大小是10。最后输出层的激活函数是Softmax,所以最后的输出层相当于一个分类器。PIL------------> Python Image Library,python第三方图像处理库。numpy---------->python第三方库,用于进行科学计算。os------------->提供了丰富的方法来处理文件和目录。
2024-06-14 11:25:02
1092
原创 C#屏蔽基类成员
要让编译器知道你在故意屏蔽继承的成员,可以用new修饰符。否则程序可以成功编译,但是编译器会警告你隐藏了一个继承的成员。可以用与积累成员名称相同的成员来屏蔽。
2024-05-23 16:04:21
484
原创 The 2023 ICPC Asia Hefei Regional Contest
B. Queue Sorting I. Linguistics Puzzle D. Balanced Array
2024-05-11 21:23:18
687
原创 The 2024 International Collegiate Programming Contest in Hubei Province, China
H. Genshin Impact Startup Forbidden III K. Points on the Number Axis B I. Colorful Tree
2024-05-02 21:46:57
1235
1
原创 Android Studio实现页面跳转
cls)构造函数创建Intent实例,第一个参数为当前Context,第二个参数为要启动的目标类。4、Intent(String action, Uri uri) 指定Action类型和Uri的构造函数,URI主要是结合程序之间的数据共享ContentProvider。Intent用于Android程序中各组件(Activity、BroadcastReceive、Service)的交互,并且可以在组件之间传递数据,所有其他字段(操作、数据、类型、类)均为 null,但稍后可以使用显式调用对其进行修改。
2024-04-18 19:25:45
2326
原创 设计和实现24位位图图片色彩翻转成互补色程序。
24位位图文件分三部分:文件信息头、图像信息头和图像像素数据),我们要搞清楚文件信息头的长度和每个字节的含义,图像信息头的长度和每个字节的含义和像素数据的格式。(提示:24位位图文件中的数据部分定义了每上像素像素单元,每个像素由三个字节组成,分别表示红、绿、蓝(r,g,b)三个分量,假设设这三量分别是x,y,z,那么255-x,255-y,255-z就是它的互补色。(2)读取文件的像素信息头的关键信息,比如:确定像素的有多少行,一行有多少像素等信息。(5)打开目标文件查看翻转后的图片,验证你的代码。
2024-04-16 13:59:28
310
原创 井字棋游戏(最大最小搜索+Alpha-Beta剪枝)
由于学习这个算法,所以大部分的代码来自github上别人的代码。就会有些问题,最主要出在他的minimax结束判断上。checkGameOver全都改了。顺便给minimax函数加点东西。
2024-03-27 23:18:29
741
原创 class 类的基本概念
类的每个实例都是不同的实体,他们有自己的一组数据成员,不同于同一类的其他实例。因为这些数据成员都和类的实例相关,所以称成为实例成员。类的声明只是用于创建类的实例的蓝图,一旦类被声明,就可以创造类的实质。new运算符为任意指定类型的实例分配并初始化空间。类是一个能存储数据并执行代码的数据结构。私有成员只能从声明他的类的内部进行访问。共有成员可以被程序中其他对象访问。包含函数成员和数据成员。
2024-01-30 13:53:21
519
1
原创 Osijek Competitive Programming Camp, Fall 2023. Day 6: Estonian Contest (The 2nd Universal Cup. Stag
回家好久没做题了,写个题解慢慢补吧,可能会补个8题左右。
2024-01-23 19:56:29
594
原创 拼题A 2024 跨年挑战赛
直接枚举矩阵上的每一个点,从每一个点的上下左右出发 ,看看能发现多少烟花,同时如果找身高比h大的就直接结束,最后更新一下最优解,和总个数。从左到右,如果是不带'+'的就两个合成下一个,带'+'的3个合成下一个,同时取模的话就是剩下合成不了的。用一个hash记录a,b,c-->(a * P * P + b * P + c)帮助我们快速匹配。如果不止一个数就把他的最大值删掉,这样vector.back()就是次大值了。按比例 n/10 n/40 n划分。if else 讨论一下。
2024-01-01 22:45:56
1066
原创 D. 金人旧巷市廛喧 wa43
就是跑到终点,还不能亏钱,流不一定要最大。就是最小费用可行流和最小费用最大流的区别。就是如果流没有到最大就继续跑下去。应该都是写成最小费用最大流。
2023-12-27 14:37:20
549
原创 折半枚举(题目)
因为最近连续两次遇到折半枚举都不会做想写个博客记录一下遇到的折半枚举的题目帮大家省去一些时间去找一些例题如果还遇到的话会持续更新,大家也可以发题目连接在评论区,有时间的话可以把遇到的折半枚举的题目都更新上去2021年中国大学生程序设计竞赛女生专场题解的话有很多,大家可以自己去搜,我是看这篇懂的。
2023-12-22 23:53:40
462
原创 第九届中国大学生程序设计竞赛桂林2023 China Collegiate Programming Contest (CCPC) Guilin Onsite (The 2nd Universal Cu
补题中。G,I,K,M
2023-11-19 10:34:38
1257
原创 多比特杯武汉工程大学第六届ACM新生赛(同步赛)D薇尔莉特能拿多少棵碧根果(拓扑)
然后做一遍拓扑,如果有点没有经过就说明以该点为起点可以进入一个环中,这是最大值是1e8。由于目标点只能从众多指向他的点选一个来加,所以我们要维护一个指向他的点的权值的最大值。在一个拓扑图中我们可以容易的判定是否存在一个圆,即圆中的值可以任意取。原图中的边u->v,我们建立方向图即v->u。我们把入读为0的边放入队列中,因为是反向图。我们需要把该点的权值赋给该点指向的目标点。其他情况直接遍历找最大值就行了。给出n个点和m条有向边。
2023-11-07 21:56:58
162
原创 抛硬币有连续x次正面的期望
0.5的概率反面,也就是继续抛直到抛到E(1)的时候结束0.5(1+E(1)),1+E(1)是操作次数。由上面可以推出E(x)=E(x-1)+0.5*1+0.5*(1+E(x))所以E(1)=E(0)+0.5*1+0.5*(1+E(1))每次都需要多乘一个反面的概率,跑个1e5次最后的结果是2。就是刚开始是E(0)也就是抛0次连续的正面需要的期望是0。0.5的概率正面就是结束了也就是0.5*1,1是操作次数。其中x是抛x次,p是在抛第x次后出现连续正面的概率。设抛x次需要的期望是E(x)
2023-10-23 12:25:06
342
原创 ccpc2023秦皇岛F. Mystery of Prime(dp)
当一个数变为1时,他周围的1一定是符合条件的,同时如果有修改成偶数的也一定符合条件。我假设当一个数改变为一个某一个偶数时,他周围的任意的奇数肯定能和他相加变成质数。当一个数变为某一个大于1的奇数时,他周围任意偶数肯定能和他相加变成质数。题目要求改变数组中的数字使相邻数字之和是质数,同时改变数字的次数最少。0修改成大于1的奇数,1修改成偶数,2修改成1, 3不修改。因为改变的数字可以无穷大。我们就可以开4维的dp。
2023-10-20 10:35:01
1115
原创 B 开组会(可持久线段树+树剖) 武汉大学2023年新生程序设计竞赛(同步赛)
然后询问的时候询问在root[min(n, dep[x] + t)] 从dfn[x]到dfn[x] + sz[x] - 1。因为你最深的深度是min(n, dep[x] + t) 此时root已经把低于最深的深度的所以数都插入进去了。dep从1-n依次把每个点的权值插入到dfn序中,同时root维护的时当前dep插入完后头节点是啥。在这个节点的基础上往下继续遍历t的深度,在这个遍历的过程中找一个最大值就行了。也就是在root[x]中已经把dep从1-x中的所有的值插入进去了。然后建一颗可持久化线段树。
2023-10-11 10:03:18
132
原创 D. Monocarp and the Set
可以从后往前看,如果是>就删除当前所有数据中最大的数,<删除最小的数 两个都只有1种选择。就是从左往右插入数据如果插入后在当前排最大的话就是>,最小的话就是<,其他?就删除最大最小数除外任意一个数 设当前有x个数 就有x-2种选择。最后再把选择数乘一下就行了。求有多少种插入数据的方法。同时第一个数一定不能是?
2023-10-10 10:43:13
254
原创 2023icpc网络预选赛I. Pa?sWorD(dp)
0-25代表小写字母,26-51代表大写字母,52-61代表大写字母,62代表什么都没有也就是初始状态。其他情况dp[now][i][(k|(1
2023-09-17 23:08:55
1411
2
原创 D1&D2. Candy Party
d1的题意是有n个人每个人都有一定的糖果,同时每个人必须给其他人一次糖果和接收其他人给他的一次糖果,同时给出的糖果和接收的数目都是2^x,最后确保每个人拥有的糖果数目一样。然后开一个数组存储需要的操作次数(这里面的东西是不可以改变的,比如有一个2^x你就必须要用下面数组中的一个-2^x去消除)然后假如要加上2^x的话操作是2^(x+1)-2^x也就是两个2^x能相互抵消并合成一个2^(x+1)d2的要求就是每个人至多给别人一次2^x个数的糖果和至多接收别人一次2^x个数的糖果。也就是可以不接受或者不给出。
2023-09-11 11:46:36
121
原创 牛客小白月赛77 D-小Why的密码锁(后缀数组)
当出现一个小于m的话,就从小跟堆中,从小往大找,看最长符合要求的次数是否等于k。然后按sa从前往后遍历,如果连续的一段都大于等于m的话,就先存在一个小根堆中。如果k等于1时i,即后缀的第一个数组,只能从1取到n-m+1。首先先按后缀排序,求出sa和height。然后i从1遍历到n-m+1得出最终结果。如果等于k的话结果++特判一下k==1的情况。特判一下是否会出现多次。
2023-09-02 00:07:52
118
原创 牛客练习赛114 G-图上异或难题(线性基)
题目要求把点涂成白和黑两种颜色,如果一条边左右两端是不同的颜色的话,结果就异或这跳边的权值,求结果最大是多少。我们只考虑白色点的情况下,如果一个点A是白色,就把结果异或上这一个点A周围的所有边,如果在该点周围还有一个白色点B的话,那么我们同样把结果异或上这个点B的所有边。因为我们知道两个点是有线段相连,而且两个点都异或上该点周围的所有边了。这时候我们就可以把这个问题转换成一个线性基的问题。已知所以点的贡献是该点异或上周围所有边。所以两个点相邻的线段就被去掉了。把边的贡献转换成点的贡献。
2023-08-26 16:09:51
262
空空如也
paddle使用中二维卷积算子较大数据时无法运行出结果
2024-05-06
数据库修改基本表为什么报错
2023-09-26
hpcpc j 骨牌游戏
2023-05-22
Python time 怎么在指定的时间内如果发生就运行下一步
2022-11-07
Python怎么根据屏幕内容移动鼠标
2022-11-06
一个数乘以1.1后为什么会大一点
2022-11-04
pta和devc++结果不一样
2022-10-26
pta运行后一直为0
2022-10-22
TA创建的收藏夹 TA关注的收藏夹
TA关注的人