
比赛
文章平均质量分 95
Wisley.Wang
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
2021微信大数据挑战赛总结(微信视频号推荐)
赛程持续大概了两个多月的时间,从笔者临近毕业到工作,算是学生时代最后一个比赛吧,遗憾的是成绩并不是很理想,最后只拿到了国二,到了复赛阶段又是被迫solo的局面。复赛期间体会到了在职人员的不易,白天上班,晚上熬夜打比赛,真的太难了┭┮﹏┭┮。最后,做为学生时代的“收官之赛”,还是在此记录下比赛过程中学习到的知识,感谢周周星的分享以及大佬们无私的开源,努力向前排优秀选手学习。一、赛题描述此次比赛基于脱敏和采样后的数据信息,对于给定的一定数量到访过微信视频号“热门推荐”的用户, 根据这些用户在视频号内的历.原创 2021-08-16 23:28:44 · 3899 阅读 · 13 评论 -
天池比赛如何使用docker提交
天池上的比赛,一般复赛阶段会让参赛选手使用docker封装好容器后,提交到线上得到结果,推理或者训练过程放在赛方提供的硬件环境下,选手一般是接触不到测试集的,更加保证了比赛的公平性。 笔者接触docker和使用已经有几次了经历了,但是都只是用于比赛,所以平时并不常使用,导致每次用的时候都要在查查资料回顾下,现在记录一下主要的提交步骤,以遍日后复习使用。一、机制天池平台提供了基于GPU计算资源的提交镜像的方式,将本地代码打包成镜像提交,推送至阿里云容器镜像仓库后,在天池提交页面中输入镜像地址、用户名.原创 2021-04-15 23:02:04 · 2085 阅读 · 2 评论 -
使用huggingface的Transformers预训练自己的bert模型+FineTuning
将“softmax+交叉熵”推广到多标签分类问题:https://zhuanlan.zhihu.com/p/138117543SGMhttps://github.com/lancopku/SGM原创 2021-04-13 15:40:55 · 37502 阅读 · 49 评论 -
多分类问题引申到多标签分类问题(softmax+交叉熵)
最近在关注和参与了一些NLP的比赛,因为我做NLP的比赛的经验不多,所以过程中还是学习到不少知识,虽然目前名次不是特别好,但前排大佬们的分享还是能get到很多想法和知识的。今天介绍的是苏神(苏剑林)的一篇文章,本文仅仅是笔者个人的解读和思考,如有错误,还望读者指正。 在很多类型的比赛,包括NLP的比赛中,往往会有多标签分类的问题,所谓多标签分类,就是一个样本会有多个类别属性的标签,例如:在心电的疾病诊断中,一个患者可能同时患有一种或多种类型的心脏疾病。不同于多分类任务,一般来说,我们可以把多标签任.原创 2021-04-01 17:37:19 · 2117 阅读 · 1 评论 -
2020中国高校计算机大赛·华为云大数据挑战赛-数据分析(二)
2020中国高校计算机大赛·华为云大数据挑战赛-数据分析(二)这里继续上次的分析,上一篇我们主要分析了数据的结构,现在我们着重看下数据的gps。一、行船轨迹这里我们话了几张相同trace的行船记录,看看他们的轨迹是否一致,为了和test保持一致,我画了出现在test里面的trace.上面的轨迹图可以看出,一些轨迹还是比较规整的,但是一部分轨迹是存在不一致的,有的船可能因为总总原因,并不是按原路线行驶,甚至会有提前登陆的情况,这种情况在test可能也会发生。为此 我们在看看test里面截断的路原创 2020-06-22 20:25:12 · 4177 阅读 · 17 评论 -
2020中国高校计算机大赛·华为云大数据挑战赛-数据分析(一)
2020中国高校计算机大赛·华为云大数据挑战赛–数据分析(一)正式赛已经开始几天了,但这几天有很多事要忙,所以每什么时间来做比赛,昨天把数据下下来,结合论坛里某个小伙伴的baseline简单分析了下数据。把一些自己的分析记录在下面,供大家参考,同时能有所启发得到一些解题的思路。首先这里放上baseline的链接,感谢姜大德的分享,提供了一份完整的从载入数据,处理数据到训练模型和提交的完整步骤!basline链接一、baselinebaseline看过后基本上可以把整个数据处理流程和提交理清楚了,这原创 2020-06-04 22:07:15 · 10721 阅读 · 37 评论 -
2020中国高校计算机大赛·华为云大数据挑战赛--热身赛 Rank7 思路及代码分享
队名:无能万金油2020中国高校计算机大赛·华为云大数据挑战赛–热身赛热身赛:Rank 7优快云博客:我的博客数据相关知识和分析参考:[上分指南] 2020华为云大数据挑战赛热身赛如何“未卜先知”Github代码:2020华为云热身赛(建议直接下载热身赛code.ipynb,里面有详细代码分析说明)比赛地址:华为云大数据挑战赛–热身赛赛题说明热身赛题——交通流量预测随着电子信息和移动通信技术高速发展和不断融合,人工智能在各个领域都相继取得了巨大的突破,城市智能体也应运而生,而城市交原创 2020-06-02 15:54:56 · 3399 阅读 · 3 评论 -
PAKDD2020 阿里巴巴智能运维算法大赛 总结(初赛33,决赛19)
赛题地址:PAKDD2020 阿里巴巴智能运维算法大赛-大规模硬盘故障预测Githun代码地址:初赛+复赛问题描述给定一段连续采集(天粒度)的硬盘状态监控数据(Self-Monitoring, Analysis, and Reporting Technology; often written as SMART)以及故障标签数据,参赛者需要自己提出方案,按天粒度判断每块硬盘是否会在未来30日内...原创 2020-04-29 13:00:03 · 4118 阅读 · 11 评论