- 博客(27)
- 收藏
- 关注
原创 java尖括号类型匹配
按照我的理解,右边的始终应该比左边具体,右边是ArrayList,左边就应该是List,现在最内层,右边是List,左边是ArrayList,左边比右边具体了,就抽象了。这个错误的原因是使用了 List<ArrayList<Integer>> levelListAll = new ArrayList<List<Integer>>();这与声明的类型不匹配,因为声明的类型期望使用的是。在这段代码中,问题在于声明的变量类型和初始化的类型不匹配。类型的对象,其中的每个元素都是。,以匹配初始化时使用的类型。
2024-03-13 16:29:24
552
原创 什么是rouge metric
举个例子,在一个seq2seq模型中,黄金标签是“police killed the gunman”,模型输出是"the gunman police killed",两句话的意思是有差别的,但是从unigram的角度,它们都包含了"The", "police", "killed", "gunman",是完全相同的。以常用的分类指标precision, recall, f1为例。
2024-02-25 12:47:24
515
原创 代码随想录第15题三数之和去重理解
nums[i-1]这个条件是不是太过严苛,会不会导致遗漏三元组,答案是不会。而如果nums[i]=nums[i-1],可以理解为这时nums[i]开头的三元组集合只会是nums[i-1]开头三元组集合的子集,因为遍历区缩小了。周文王打仗时,会把军队分为左军,中军,右军。i可以理解为当前作为左军的人员,i-1可以理解为上一次战斗作为左军的人员,当左军都不同,整个军队也会不同,这就是马哲里的部分不同,整体也会不同。但是本题要求不能出现重复的三元组,例如[[0,0,0],[0,0,0]] 这种结果是不可取的。
2024-02-08 10:46:30
450
原创 GPT原始论文:Improving Language Understanding by Generative Pre-Training论文翻译
自然语理解包括文本蕴含、问题回答、语义相似性评估和文档分类等一系列多样化的任务。尽管大量未标注的文本语料库很丰富,但用于学习这些特定任务的标注数据却很稀缺,这使得基于区分性训练的模型难以充分发挥作用。我们展示了通过在多样化的未标注文本语料库上对语言模型进行生成式预训练,随后对每个特定任务进行区分性微调,可以实现这些任务的大幅度改进。与以往的方法不同,我们在微调过程中使用了任务感知的输入转换,以实现有效的迁移,同时几乎不需要改变模型架构。我们在自然语言理解的广泛基准测试上证明了我们方法的有效性。
2024-02-04 17:04:42
2374
1
原创 Emotion Cause Extraction on Social Media without Human Annotation
为了解决以上这两个问题,本篇文章提出了两种改进策略。实验结果证实了在无监督和弱监督场景下,作者的方法相比于其他方法具有优势。
2024-01-29 16:47:26
956
3
原创 自然语言处理,基于预训练语言模型的方法,车万翔,引言部分
随着互联网的迅速发展,产生了各种各样的用户生成内容(User Generated Content,UGC),其中很多内容包含着人们的喜怒哀惧等情感,对这些情感的准确分析有助于了解人们对某款产品的喜好,随时掌握舆情的发展。之后,Siri在和用户的不断对话中,会不断跟踪当前用户语义和状态,例如用户想将机票从北京改到上海,Siri会在槽值中,将到达地所在槽对应的值修改为上海。Siri会首先解析并理解用户的请求,分析用户的语义,获得用户的领域为机票,意图为订机票,并将关键信息存入槽值构成的列表。
2024-01-27 11:32:42
1359
原创 加1平滑(折扣法的一种)损有余而补不足
采用加1平滑,补不足,增加那些从来没有出现过的n-gram的出现概率(之前利用频次估计的概率可能为0,即不可能事件,太过绝对,加1使冷门n-gram概率估计很小但不为0);同时损有余,削弱热门n-gram的出现概率(类比于王者荣耀的强势英雄,所有英雄都加强了,强势英雄相对就削弱了,或者是一个分数,分子增加了1,但是分母增加了100,分数的值也即出现概率相对也就缩小了)。极端情况下,当字串就是文档本身,或者文档除去最后一个词外的所有词,这时频次为1,估计的偶然性较大。的条件下,对下一时刻t可能出现的词。
2024-01-23 22:52:47
467
原创 Multi-Graphs/Multi-Dimensional Edges: TensorGCN, ME-GCN
这两种模型都旨在利用文本数据中的语义和关系信息,以支持各种自然语言处理任务。TensorGCN强调语义、句法和顺序信息的整合,而ME-GCN关注多维嵌入和边的构建。它们都使用图神经网络(GCN)来进行信息传播和学习。
2024-01-15 22:14:11
431
原创 BLIP2源码阅读-LAVIS/app/__init__.py
可以把使用频率较高的一部分,如你最喜欢的那本或者你平时最常使用的那本,保存到一个触手可及的地方,如身边书架上,这样使用起来就会节省时间。device定义了模型在gpu上运行(如果gpu可用的话,即torch.cuda.is_available()),否则模型在cpu上运行,运行的速度会变慢。综上所述,这行代码的作用是从给定的网址下载图片,并将其转换为RGB模式,以便于进一步处理或显示。对象的一个属性,它提供了原始的响应内容(在这个情况下是图片的数据)。最后返回转换后的demo图片,供后续展示使用。
2024-01-15 22:01:29
947
原创 Linux命令记录
pip3 list的输出是一段包的列表,里面有所有已经使用pip安装的包,包的名称存放在列表中。在使用python安装matplotlib时,使用这样一条命令。然后使用grep命令去检索包含matplotlib的行。
2023-12-10 12:48:47
462
3
原创 BertTokenizer.from_pretrained(configs.bert_cache_path)是什么
方法、加载权重和配置、实例化分词器对象以及进行分词处理这几个步骤来完成的。这个过程可以确保我们在使用 BERT 或其他基于 Transformer 的模型进行自然语言处理任务时,能够利用已经在大量数据上训练过的分词器来提高性能。总之,预训练分词器的加载过程是通过指定路径、调用。
2023-12-07 16:50:10
825
2
原创 机器学习,什么是一个epoch
在这个过程中,模型会尝试学习数据集中的所有样本,并根据损失函数更新其权重。通常,一个epoch包含多个训练步骤(或称为batches),每个步骤都会将一小部分数据输入模型进行训练。完成整个数据集的训练后,模型将进行一次验证或测试,以检查其在未见过的数据上的性能,这有助于评估过拟合和泛化能力。在深度学习和机器学习中,一个epoch表示将整个训练数据集通过神经网络一次(即进行一次正向传播和一次反向传播)的过程。然后,可以根据需要重复多个epoch来进一步提高模型的性能。
2023-12-07 16:17:41
1204
原创 预热步数学习博客
预热步数表示在训练开始时的一个阶段,学习率会逐渐增加到预设的最大值,然后开始逐渐减小。这个阶段有助于模型训练的稳定性。简单来说,这行代码计算出了在整个训练过程中,学习率逐渐增加的那个阶段的步数。表示预热步数,它是在训练深度学习模型时的一个重要参数。相乘,我们得到了预热步数。通过将总梯度更新次数。
2023-12-07 15:59:14
647
原创 关于num_steps_all = len(train_loader) // configs.gradient_accumulation_steps * configs.epochs的理解,文心一言
所以,你总共会看 100 × 3 = 300 张纸。但由于你每看5张纸才更新一次参数,所以你实际上会更新 300 ÷ 5 = 60 次参数。这行代码就是在做这样的计算:它算出在整个训练过程中,模型参数会更新多少次。希望这样的解释能帮助你理解!这行代码计算的是在整个训练过程中,模型参数会更新的总次数。当然可以,我会尽量用简单的语言来解释这行代码。
2023-12-07 15:50:04
628
原创 UniCOQE: Unified Comparative Opinion Quintuple Extraction as A Set
比较意见五元组提取(COQE)旨在识别产品评论中的比较意见句子,提取句子中的比较意见元素,然后将其纳入五元组。现有的方法将COQE任务分解为多个主子任务,然后以管道的方式解决它们。然而,这些方法忽略了子任务之间的内在联系和阶段之间的错误传播。为了一次性解决COQE任务,本文提出了一种统一的生成模型UniCOQE。我们设计了一个生成模板,其中所有比较元组被连接作为目标输出序列。然而,多个元组本质上不是有序序列,而是无序集合。预先定义的顺序会迫使生成模型学习错误的顺序偏差,从而影响模型的训练。为了减轻这种偏见,
2023-12-07 14:59:13
1258
原创 404 Not found 是怎么回事
据说在第三次科技革命之前,互联网的形态就是一个大型的中央数据库,这个数据库就设置在404房间里面。那时候所有的请求都是由人工手动完成的,如果在数据库中没有找到请求者所需要的文件,或者由于请求者写错了文件编号,用户就会得到一个返回信息:room 404 : file not found。后来互联网兴起后,人们也就习惯了用404作为服务器未找到文件的错误代码了。当然实际考证传说中的room 404是不存在的。
2023-12-07 08:34:48
354
原创 sys.path.append(‘..‘) 文心一言介绍
是在运行时动态改变模块搜索路径的方法,这可能会对代码的可移植性和可维护性产生一定影响。因此,在使用这种方法时要谨慎考虑。,你实际上是将上一级目录添加到了这个列表中,从而使得 Python 能够在上一级目录中查找和导入模块。在 Python 中,当你尝试导入一个模块时,解释器会在特定的目录中查找该模块。这行代码的作用是将当前工作目录的上一级目录添加到 Python 的模块搜索路径中。这在你需要导入上级目录中的模块或包时特别有用。来添加上级目录到模块搜索路径,然后使用。
2023-12-05 16:34:52
3245
原创 How to clone a project from GitHub to local directory
Because I always forget things, and for the conveniene of 归类整理博客,记录一次从github上clone项目的经历。要克隆的项目是ACL 2020的一篇论文,题目是Rank-Emotion-cause.首先看一下它的readme.md。
2023-12-05 16:30:16
1063
原创 BLUE作为机器翻译自动评价指标的计算方法
1、先求macro-Recall和macro-Pecision,之后由这两个和求macro-F1;2、对三个类别的F1-score直接求平均(即上述计算方法)。在sklearn中,使用的是第二种。其实macro-F1有。
2023-11-15 10:11:13
323
原创 github 下载文件夹
在搜索框内输入要下载文件夹的链接,如图中1所示,点击create download link,会生成下载链接 ,如图中的2所示。即可出现上图所示的弹窗,待下载文件会被压缩为zip文件。弹出弹窗,要求选择zip文件路径,将其保存到本地。之后,在上图中,将下载链接复制到1所示的浏览器url栏,点击回车键。使用工具downloadzip,工具链接分享给大家。以上就完成了一次github文件夹的下载。
2023-11-13 11:49:26
394
1
原创 http协议
互联网早期,输入的信息只能保存在本地,无法和其他电脑交换信息。我们的信息都以文本即简单字符存在,文本是一种能被计算机解析的有意义的二进制数据包。随着互联网的迅速发展,人们不满足于只能在两台电脑之间传输文字,还想传输图片、音频、视频甚至进行超接跳转等,文本的含义扩大了,扩大后的文本称为超文本(Hypertext)什么是传输两台计算机进行互联通信,是通过传输载体(如同轴电缆,电话线,光缆)进行的,存储的超文本需要解析为二进制数据包,在传输载体上进行传输。称为传输。
2023-11-09 10:47:28
40
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人