
竞赛
文章平均质量分 86
余俊晖
余俊晖,NLP炼丹师,目前专注自然语言处理领域研究。曾获得国内外自然语言处理算法竞赛TOP奖项近二十项。在国内外SCI、顶会等发表多篇论文。
展开
-
讯飞AI算法挑战大赛-校招简历信息完整性检测挑战赛-三等奖方案
本文公开了”讯飞AI算法挑战大赛-校招简历信息完整性检测挑战赛“赛道的技术方案,本次比赛主要采用pdf解析和特征工程的方法,通过使用lightgbm的树模型10折交叉验证进行二分类的任务,最终取得三等奖的成绩。本次比赛主要采用pdf解析和特征工程的方法,通过使用lightgbm的树模型10折交叉验证进行二分类的任务。原创 2023-11-07 10:07:00 · 506 阅读 · 1 评论 -
第四届“中国法研杯”司法人工智能挑战赛-刑期预测赛道三等奖方案
本文将回顾第四届“中国法研杯”司法人工智能挑战赛-刑期预测算法赛道比赛。使用多任务预训练、然后进行微调的形式最终在比赛中取得了三等奖的成绩。原创 2023-05-18 14:50:03 · 1405 阅读 · 1 评论 -
CCF大数据与计算智能大赛-基于人工智能的漏洞数据分类冠军方案
本文提出一种多任务文本分类算法,通过共享BERT embedding,设计多任务的损失函数,端到端的解决漏洞数据分类问题。最后通过大量的实验及相关模型优化,最终获得本次大赛冠军。原创 2023-05-17 12:09:38 · 1365 阅读 · 0 评论 -
杭州全球人工智能技术创新大赛-商品标题实体识别一等奖方案(top3)
使用分层学习率、对抗训练、swa等技术,增加模型拟合性能和鲁棒性;采用预训练和伪标签结合的方式,在有限的场景下提高单模型的性能;通过多折交叉清洗,在避免引入人工的前提下减少数据噪声的影响。原创 2023-03-28 15:18:12 · 431 阅读 · 0 评论 -
2021全球开放数据应用创新大赛-法律咨询问答亚军方案
首先从多个预测答案中抽取出第一条作为预测答案,其余作为标准答案;然后计算出预测答案和所有标准答案的分值,累加起来作为该预测答案的得分;最后选取得分最高的作为最终答案。这种模型融合方式适用于阅读理解、摘要等复杂任务。原创 2023-03-26 20:07:00 · 516 阅读 · 0 评论 -
竞赛trick-AWP对抗训练的即插即用实现
对抗训练就是使用对抗样本去训练模型,从而通过对原始训练数据添加噪声便得到了对抗样本。在竞赛中常在BERT的embedding阶段进行扰动,常使用的对抗训练有pgd,fgm,freelb等。(缘故:在刚结束的腾讯微信大数据挑战赛-多模态短视频分类竞赛中有大幅度提升)。原创 2022-09-19 14:31:06 · 1518 阅读 · 2 评论