- 博客(23)
- 收藏
- 关注
原创 AI 大模型有哪些实际落地场景
答案是肯定的呀,现在AI大模型已经在很多场景上都落地了。如果说2023年大家是大模型基座井喷的一年,那么今年就是大模型应用爆发的一年。并且现在很多大模型应用都已经比较成熟,例如:角色扮演,智能问答、辅助写作、代码编程、生活顾问、论文助手等。AI大模型毫无疑问已经成为了生活上和工作上的利器。并且随着现在大模型基座模型的效果越来越好,构建下游应用的成本也变得更低,更容易。目前国内的基座大模型发展的也是十分迅速,像智谱 BigModel开放平台的GLM系列大模型就可以快速搭建上面提到应用。
2024-09-14 16:22:37
1023
2
原创 ACL2022 | DCSR:一种面向开放域段落检索的句子感知的对比学习方法
面向开放域段落检索的句子感知的对比学习,通过引入「段落内负例抽样策略」,使得同一段落内容中生成「不同得句子表征」,构建一个基于更小粒度得上下文句子表征模型,从而解决在对比学习训练过程中,将同一个段落向量与多个语义差异较大问题向量对应的冲突问题...
2022-06-13 17:51:44
411
原创 ACL2022 | NoisyTune:微调前加入少量噪音可能会有意想不到的效果
昨天看完NoisyTune论文,做好实验就来了。一篇ACL2022通过微调前加入给预训练模型参数增加噪音提高预训练语言模型在下游任务的效果方法-NoisyTune,论文全称《NoisyTune: A Little Noise Can Help You Finetune Pretrained Language Models Better》。......
2022-06-13 17:51:23
402
原创 ACL2022 | DictBERT:通过低频词典增强预训练模型表征方法
今天给大家带来一篇acl2022通过低频词典增强预训练模型表征论文-Dict-BERT,全名为《Dict-BERT: Enhancing Language Model Pre-training with Dictionary》
2022-06-12 18:45:55
907
原创 ACL2022论文分类汇总-Prompt、句子表征、检索排序&摘要
ACL2022会议的论文已经出来一阵子了,将论文列表过了一边,筛选了一些自己正在做或者感兴趣方向的相关论文,包括:Prompt(35篇)、句子表征(21篇)、检索排序(13篇)、摘要(35篇)和其他(11篇,个人觉得蛮有意思的论文)。...
2022-06-12 18:45:09
2959
原创 总结 | Prompt在NER场景的应用
最近在做Prompt的相关内容,本人意识中一直觉得Prompt机制在序列标注任务上不是很好转换,因此,很早前,组长问我时,我夸下海口,说:“谁用prompt做NER呀”。然后,调研发现大佬们真是各显神通,是我目光短浅了。于是,决定进行一番总结,分享给大家。「有点长,大家慢慢看~~~」...
2022-06-12 18:44:26
2599
1
原创 EASE:一种融合实体信息的句子嵌入对比学习方法
今天给大家带来一篇NAACL2022论文,一种融合实体信息的句子嵌入对比学习方法,全名为《EASE: Entity-Aware Contrastive Learning of Sentence Embedding》。主要在传统的句子和句子之间的对比学习中,融入句子和实体的对比学习,提高最终句向量模型的效果。...
2022-06-12 18:43:16
539
原创 NAACL2022-Prompt相关论文&对Prompt的看法
最近在做Prompt的相关,整理NAACL2022中Prompt相关的论文,并把论文中对应的Github链接也附上了。并且一些自己特别感兴趣的论文,已经标星”*“,希望对大家有所帮助。后面也简单谈了谈对Prompt的看法,不是吐槽,不是吐槽,只是一些自己的真实感受。...
2022-06-12 18:42:29
1219
原创 PolyLoss:一种将分类损失函数加入泰勒展开式的损失函数
前两天实习生给我推了一篇针对损失函数进行优化的论文,一种将分类损失函数加入泰勒展开式的损失函数-PolyLoss,全名《POLYLOSS: A POLYNOMIAL EXPANSION PERSPECTIVE OF CLASSIFICATION LOSS FUNCTIONS》。由于该篇论文是在图像任务上进行实验的,抱着试一试的心态,在NLP的AFQMC数据上进行了实验,发现是有提升的,因此分享给大家。...
2022-06-12 18:41:07
939
1
原创 PERT:一种基于乱序语言模型的预训练模型
今天分享给大家一篇哈工大讯飞联合实验室的论文,一种基于乱序语言模型的预训练模型-PERT,全名《PERT: PRE-TRAINING BERT WITH PERMUTED LANGUAGE MODEL》。该篇论文的核心是,将MLM语言模型的掩码词预测任务,替换成词序预测任务,也就是在不引入掩码标记[MASK]的情况下自监督地学习文本语义信息,随机将一段文本的部分词序打乱,然后预测被打乱词语的原始位置。...
2022-06-12 18:40:24
1427
1
原创 DiffCSE:结合句子间差异的无监督句子嵌入对比学习方法
今天分享给大家一篇NAACL2022论文,结合句子间差异的无监督句子嵌入对比学习方法-DiffCSE,全名《DiffCSE: Difference-based Contrastive Learning for Sentence Embeddings》。该篇论文主要是在SimCSE上进行优化,通过ELECTRA模型的生成伪造样本和RTD(Replaced Token Detection)任务,来学习原始句子与伪造句子之间的差异,以提高句向量表征模型的效果。...
2022-06-12 18:38:31
444
原创 SIGIR2022论文筛选
SIGIR2022会议的论文列表前一段时间放出来了,由于个人时间关系,今天将论文列表过了一边,筛选了一些自己正在做或者感兴趣方向的相关论文,包括:检索排序、小样本、生成、摘要、文本表征、问答等。...
2022-06-12 18:34:38
1384
1
原创 OpenAI:基于对比学习的预训练文本&代码表征技术
今天给大家带来一篇OpenAI的论文,基于对比学习预训练的文本和代码表征,全名《Text and Code Embeddings by Contrastive Pre-Training》。其实,这篇论文在春节放假期间我就看了,模型是套用GPT-3的模型,只是采用对比学习的方法,又继续预训练了一波;但是里面有个结论假设还挺有意思的,就是「搜索任务和句子相似任务,在句向量表征中是冲突的。」......
2022-06-12 18:31:08
1212
2
原创 SNCSE:一种基于软负例的无监督句向量对比学习方法
早上刷arxiv时,发现一篇通过「软负样本」结合「双向边际损失」的无监督句子嵌入对比学习方法-SNCSE。今天分享给大家,全名《SNCSE: Contrastive Learning for Unsupervised Sentence Embedding with Soft Negative Samples》。...
2022-06-11 13:35:54
534
原创 SimCSE论文精读
「句向量表征技术」一直都是NLP领域的热门话题,在BERT前时代,一般都采用word2vec训练出的word-embedding结合pooling策略进行句向量表征,或者在有训练数据情况下,采用TextCNN/BiLSTM结合Siamese network策略进行句向量表征。...
2022-06-11 13:34:07
2361
2
原创 PairSCL:句子对级别的有监督对比学习方法
这些方法仅关注了句子对中每个句子的表征,没有考虑不同类别中句子对之间的关系。针对NLI任务,该论文提出句子对级别的有监督对比学习方法,即「采用交叉注意力机制学习句子对的联合表征,并通过对比学习,将相同类别的句子对表征拉到一起,不同类别的句子对表征推开」。...
2022-06-11 13:31:20
344
原创 COLD:中文冒犯性语言检测数据集
早上刷arxiv时,发现一篇中文「冒犯性语言」检测数据集的论文,全名为《COLD: A Benchmark for Chinese Offensive Language Detection》
2022-06-11 13:29:13
3273
2
原创 算法不会前端,也可以做出好看的界面-Streamlit
今天给大家推荐一个超级好用的工具Streamlit,无需任何前端知识(HTML、CSS、JS),只需要python写写markdorn就可以构建一个蛮不错的Demo页面。
2022-06-11 13:25:14
1866
原创 ExtraPhrase:一种针对抽象式(生成式)摘要的数据增强方法
一篇针对抽象式(生成式)摘要的数据增强方法-ExtraPhrase,今天分享给大家,全名《ExtraPhrase: Efficient Data Augmentation for Abstractive Summarization》
2022-06-11 13:20:17
343
原创 MatchSum-一种基于语义匹配的抽取式摘要框架
今天给大家带来一篇通过语义匹配进行抽取式摘要的论文「MatchSum」,发表于ACL2020,全名《Extractive Summarization as Text Matching》。
2022-06-11 13:19:14
709
原创 BertSum-基于BERT模型的抽取式文本摘要
最近在梳理文本摘要相关内容,翻到一篇19年关于基于BERT模型进行抽取式摘要的老文「BertSum」,在这里分享给大家。
2022-06-11 13:17:54
3846
1
原创 CPT模型:一种中文兼顾NLU和NLG的非平衡预训练语言模型
在该篇论文中,提出了一种新的中文预训练非平衡变压器CPT,它同时适用于NLU和NLG任务。
2022-06-11 13:10:21
1590
原创 中文文本匹配数据集整理
整理中文文本匹配(文本相似度)数据集了,后面准备基于该数据集,训练一个句向量表征模型。不找不知道,一找吓一跳,共整理了「16个」可用于文本匹配任务。
2022-06-11 13:07:21
3096
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人