2020 天马杯 AI+ 智能质检 top4方案

博客分享了AI质检竞赛相关内容,给出开源代码和赛题简介链接,决赛新增ASR题采用开源实现。总结建模方案,指出A榜前列用BERT滑窗分类有引入噪声、丢失全局信息的缺点,B榜前列用传统特征结合建模增益大、稳健性强,还建议构建文本特征做模型融合刷分。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

开源代码:https://github.com/aBadCat/2020msxf-AI-quality-inspection-competition-4th-place/tree/main/Hierarchical%20Attention%20Network

赛题简介:https://blog.youkuaiyun.com/qqMiSa/article/details/109264698,除此之外决赛还新增了一个ASR题,由于ASR了解不多,赛程时间短,基本只是采用了https://github.com/Z-yq/TensorflowASR中的开源实现

一点总结:

我们建模方案与其他团队不同,A榜在我们之前的队伍大多使用BERT滑窗分类进行平均建模输出的base,这类队伍在B榜名次下滑严重。

bert在处理长文本上做滑窗存在两个缺点:

1. 滑窗文本标签引入大量噪声

2. 滑窗文本关注局部,丢失大量全局信息

B榜在我们之前的团队几乎都使用了传统特征结合建模的方式(哈哈我们也想用来着,但是队友之间建模沟通出现了失误后面没时间做了),多特征构造在帮助模型捕捉全局信息上增益很大,且稳健性强。

如果想要进一步刷分,还是应该进一步通过构建文本特征加入stacking做模型融合的方式。

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值