自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 LoRA论文精读(上) Low-Rank Adaptation of Large Language Models

本篇博客针对LoRA: Low-Rank Adaptation of Large Language Models的提出背景和算法原理做了非常清晰简明的讲解,适用于想要快速了解一下LoRA底层方法的学习者。对于原文的实验和未来工作等部分的详细介绍在https://blog.youkuaiyun.com/weixin_72032564/article/details/143834458中,如有兴趣,可以再进一步阅读。

2024-12-07 19:57:34 1546

原创 可解释性机器学习入门:SHAP方法

随着机器学习特别是深度学习的应用越来越广泛,其“黑箱”特性(即模型内部复杂的决策机制难以理解)带来了信任、伦理、法律和安全等方面的挑战,因此可解释性变得至关重要,本篇博客对其做了相关讲解并结合实战重点介绍了SHAP这种模型无关的解释方法,希望能对大家有所帮助。

2024-12-05 21:08:06 3472

原创 LoRA论文精读(下) Low-Rank Adaptation of Large Language Models

现在网上对LoRA的解读文章大多非常粗暴地粘贴了原文内容、实验结果以及翻译了实验结论,对于怎么得出结论的以及一些背景知识都没有很细的讲解,本篇博客针对LoRA: Low-Rank Adaptation of Large Language Models原文的第五节实验部分,第七节理解低秩更新以及Future Work部分进行了详细解读,并顺带总结了之后LoRA的各种变体以及LoRA在NLP(如命名实体识别等)和CV(如Stable Diffusion)领域的具体应用。

2024-11-20 10:49:51 852

原创 文本向量化-词嵌入方法系列2:动态词嵌入(ELMo+BERT+XLNet)

本文主要介绍了分散式文本表示中的三种动态词嵌入方法:ELMo、BERT和XLNet,介绍了每种模型的结构特点以及它们之间的对比。

2024-11-09 15:19:22 940

原创 文本向量化-词嵌入方法系列1:静态词嵌入(Word2Vec+GloVe)

本文主要介绍了分散式文本表示中的两种静态词嵌入方法:Word2Vec和GloVe,描述了它们的计算词向量的过程并对两者进行了对比。

2024-11-08 21:24:32 1359

原创 Financial distress prediction(企业财务困境预测)-论文精选

在入门金融风险预测时,通过各种渠道查阅学习了很多文献,花了不少精力。在这里做一个简短的总结博客,主要关注公司财务困境预测,这种预测能帮助投资者更好地了解企业,并允许银行和其他金融机构建立预警系统,避免风险传播。希望能帮助大家节省时间,快速了解这一领域,后续将持续更新,如有不足,欢迎批评指正。

2024-10-25 14:33:10 884

原创 NER-命名实体识别 序列生成方法

序列生成方法是将NER任务视为一个序列生成的过程,输入为原始文本,输出为相应的实体标签序列或者加上标签后的原文本序列,它与序列标注的方法的一大区别是它更灵活,不要求输出序列与输入序列的长度严格相同。

2024-10-23 10:28:33 1314

原创 中英文检测/语言识别分类的实用方法介绍

我在实习和写课程大作业的过程中都遇到过这样的问题,一个网站要支持多语言,有的时候就需要分语言训练模型,所以第一步就是识别用户输入的语言类型,然后再把inputted_sentence传给对应语言的工作流。但是感觉网上没有特别全面的方法介绍,因此我自己总结了以下两方面的方法分享给大家:(1)通过Unicode范围安装比例自己写一个简单函数(2)直接调用别人写好的工具包(langdetect,langid,fastText等)。

2024-10-15 08:29:46 906

原创 Python爬虫快速入门(Requests+BeautifulSoup+Scrapy)

爬虫是重要的数据获取方式,下面主要介绍3种常用的Python库:Requests,BeautifulSoup和Scrapy,教你轻松入门Python爬虫

2024-10-13 12:55:33 1262 1

原创 ACL2023-NER相关论文解读:SplitNER

今天要讲的这篇文章是发表在ACL2023会议上的Split-NER,文章题目如下,主要就是用pipeline方法先进行span detection再进行classification,两步操作都采用了QA的方式向模型进行提问,兼顾平衡了effective(train faster)和efficient(perform better),启示是以后对于复杂的NLP任务都可以采用先分解成several different sub-tasks,然后分别微调LLM解决。

2024-10-11 10:45:36 865

原创 NER-命名实体识别 入门解读

简单介绍了解决NER任务中的sequence labeling(序列标注)、interval prediction(区间预测)和question answering(问答)三种方法

2024-10-09 17:39:12 2189 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除