提升动手实践能力!Datawhale精选赛事合集

 Datawhale精选 

来源:科大讯飞AI开发者大赛

6年前,科大讯飞作为人工智能国家队的成员,正式启动“科大讯飞 AI 开发者大赛”。累积参赛队伍已经超过十万支,已经成为国内规模最大、举办时间最长的人工智能赛事之一。

今年的赛事已经基本告一段落,从中我们精选了一些适合能力提升的长期赛,并开源了 Baseline,期望能帮助大家梳理基础知识,提升动手实践能力!

精选赛事分为 机器学习、NLP、大模型 三个方向,以下是赛事目录,大家可以按需查看:

  1. 机器学习:网络安全入侵检测挑战赛

  2. 机器学习:电力需求预测挑战赛

  3. 机器学习:短视频精准推荐挑战赛

  4. NLP:问答意图聚类挑战赛

  5. 大模型能力评测:中文成语释义与解释挑战赛

  6. 大模型图文匹配识别挑战赛

  7. 大模型RAG智能问答挑战赛

  8. 大模型图像风格迁移挑战赛

精选赛事全合集:

https://datawhaler.feishu.cn/docx/Dxe9d7i4WoayNOxrNMrclZRanuf?from=from_copylink

「1. 网络安全入侵检测挑战赛」

赛题背景:

随着互联网技术的飞速发展,网络安全已经成为全球关注的焦点。网络入侵事件频发,给个人隐私、企业数据安全乃至国家安全带来了严重威胁。为了提高网络安全防护能力,有效识别和防御各种网络攻击和入侵行为,本场比赛以“网络安全入侵检测”为主题的技术挑战赛。选手根据训练数据构建模型,预测是否存在网络攻击以及对应的攻击类型。

Baseline链接:

https://github.com/datawhalechina/competition-baseline/blob/master/competition/%E7%A7%91%E5%A4%A7%E8%AE%AF%E9%A3%9EAI%E5%BC%80%E5%8F%91%E8%80%85%E5%A4%A7%E8%B5%9B2024/%E7%BD%91%E7%BB%9C%E5%AE%89%E5%85%A8%E5%85%A5%E4%BE%B5%E6%A3%80%E6%B5%8B%E6%8C%91%E6%88%98%E8%B5%9B_baseline.ipynb

5fc5e2a9ae0f9d9f1db6682c994e874e.png

扫码参与

「2. 电力需求预测挑战赛」

赛题背景:

随着全球经济的快速发展和城市化进程的加速,电力系统面临着越来越大的挑战。电力需求的准确预测对于电网的稳定运行、能源的有效管理以及可再生能源的整合至关重要。

然而,电力需求受到多种因素的影响,为了提高电力需求预测的准确性和可靠性,推动智能电网和可持续能源系统的发展,本场以“电力需求预测”为赛题的数据算法挑战赛。选手需要根据历史数据构建有效的模型,能够准确的预测未来电力需求。

Baseline链接:

https://datawhaler.feishu.cn/wiki/CuhBw9vBaiG1nJklIPkcRhqVnmk?fromScene=spaceOverview

13e4d1521e9ed8b5db6c3564e1d46490.png

扫码参与

「3. 短视频精准推荐挑战赛」

赛题背景:

在数字化时代,短视频平台迅速崛起,成为人们获取信息、娱乐和社交的重要渠道。随着用户数量的激增和内容创作的多样化,如何精准地推荐用户感兴趣的短视频内容,提升用户体验,成为短视频平台面临的关键挑战。为了增强平台的用户粘性和内容分发效率,本次算法挑战赛聚焦在“短视频精准推荐”,旨在推动短视频推荐算法的创新和优化。

Baseline链接:

https://github.com/datawhalechina/competition-baseline/blob/master/competition/%E7%A7%91%E5%A4%A7%E8%AE%AF%E9%A3%9EAI%E5%BC%80%E5%8F%91%E8%80%85%E5%A4%A7%E8%B5%9B2024/%E7%9F%AD%E8%A7%86%E9%A2%91%E7%B2%BE%E5%87%86%E6%8E%A8%E8%8D%90%E6%8C%91%E6%88%98%E8%B5%9B_baseline.ipynb

8df5388c0c1668cf1f64a8936681a382.png

扫码参与

「4. 问答意图聚类挑战赛」

赛题背景:

随着人工智能技术的快速发展,尤其是在自然语言处理(NLP)领域,机器理解人类语言的能力不断增强。问答系统作为NLP的一个重要应用,其核心目标是使机器能够理解用户的问题并提供准确的答案。然而,随着问答数据量的增加,如何高效地组织和管理这些数据,使其能够更好地服务于问答系统,成为一个亟待解决的问题。

问答意图聚类挑战赛正是在这样的背景下应运而生。本次赛题需要参赛选手设计有效的聚类算法,将具有相同或相似意图的问题分组在一起。这不仅可以帮助问答系统更高效地检索答案,还可以提高用户查询的体验。

Baseline链接:

https://github.com/datawhalechina/competition-baseline/blob/master/competition/%E7%A7%91%E5%A4%A7%E8%AE%AF%E9%A3%9EAI%E5%BC%80%E5%8F%91%E8%80%85%E5%A4%A7%E8%B5%9B2024/%E9%97%AE%E7%AD%94%E6%84%8F%E5%9B%BE%E8%81%9A%E7%B1%BB%E6%8C%91%E6%88%98%E8%B5%9B_baseline.ipynb

19bc3ef292bcc6196e8d2f1d70eab44b.png

扫码参与

「5. 大模型能力评测:中文成语释义与解释挑战赛」

赛题背景:

本次赛事旨在挑战和提升模型对中文成语的深入理解能力。选手需要构建模型,通过理解成语在具体语境中的使用,从给定的候选成语中选择最合适的选项,填补文本中的空白。这一任务不仅考察模型对成语基本义项的掌握,更考验其对成语深层次含义及使用场景的精准把握。

Baseline链接:

https://datawhaler.feishu.cn/docx/Y75Udp2rxoDZqRxhWPbc7yzhnpe

151809c1bbbec458121909c16f262251.png

扫码参与

「6. 大模型图文匹配识别挑战赛」

赛题背景:

在大模型应用场景中,多模态学习是一个重要的研究方向,它涉及到将不同模态的信息(如文本、图像、音频等)进行有效整合,以提高模型的理解和表达能力。图文匹配识别作为多模态学习中的一个关键问题,要求模型能够理解图像内容并将其与相应的文本描述进行匹配。模型需要能够理解图像的视觉信息和文本的语义信息,并将两者进行有效关联。模型需要识别图像和文本之间的语义关系,即使在存在一定程度的语义差异时也能正确匹配。

Baseline链接:

https://github.com/datawhalechina/competition-baseline/blob/master/competition/%E7%A7%91%E5%A4%A7%E8%AE%AF%E9%A3%9EAI%E5%BC%80%E5%8F%91%E8%80%85%E5%A4%A7%E8%B5%9B2024/%E5%A4%A7%E6%A8%A1%E5%9E%8B%E5%9B%BE%E6%96%87%E5%8C%B9%E9%85%8D%E8%AF%86%E5%88%AB%E6%8C%91%E6%88%98%E8%B5%9B_baseline.ipynb

2d8578745cebe7392b8fe2128115cdc8.png

扫码参与

「7. 大模型RAG智能问答挑战赛」

赛题背景:

RAG(检索增强生成)是一种结合了检索模型和生成模型的技术,它通过检索大量外部知识来辅助文本生成,从而提高大型语言模型(LLMs)的准确度和可靠性。

RAG特别适合于需要不断更新知识的知识密集型场景或特定领域应用,它通过引入外部信息源,有效缓解了大语言模型在领域知识缺乏、信息准确性问题以及生成虚假内容等方面的挑战。本次挑战赛旨在探索RAG技术的极限,鼓励开发者、研究人员和爱好者利用RAG技术解决实际问题,推动人工智能领域的进步。

Baseline链接:

https://github.com/datawhalechina/competition-baseline/blob/master/competition/%E7%A7%91%E5%A4%A7%E8%AE%AF%E9%A3%9EAI%E5%BC%80%E5%8F%91%E8%80%85%E5%A4%A7%E8%B5%9B2024/%E5%A4%A7%E6%A8%A1%E5%9E%8BRAG%E6%99%BA%E8%83%BD%E9%97%AE%E7%AD%94%E6%8C%91%E6%88%98%E8%B5%9B_baseline.ipynb

6723134d2250e6478a758a8a92f9920b.png

扫码参与

「8. 大模型图像风格迁移挑战赛」

赛题背景:

本次挑战赛旨在促进人工智能领域的研究和应用,特别是在图像风格迁移方面。参赛者需要开发和训练大规模深度学习模型,将简笔画转换为逼真的原始图片。这一挑战不仅考验参赛者的技术能力,还需要他们在创新性、艺术性和实用性之间找到平衡。

比赛的核心任务是把简笔画生成对应的逼真图片。这一任务涉及图像处理、计算机视觉和深度学习等多学科知识。参赛者需要构建并优化模型,使其能够理解简笔画的基本结构和特征,并生成高质量的、细节丰富的原始图片。

Baseline链接:

https://github.com/datawhalechina/competition-baseline/blob/master/competition/%E7%A7%91%E5%A4%A7%E8%AE%AF%E9%A3%9EAI%E5%BC%80%E5%8F%91%E8%80%85%E5%A4%A7%E8%B5%9B2024/%E5%A4%A7%E6%A8%A1%E5%9E%8B%E5%9B%BE%E5%83%8F%E9%A3%8E%E6%A0%BC%E8%BF%81%E7%A7%BB%E6%8C%91%E6%88%98%E8%B5%9B_label.ipynb

b24bf529c5752578043e17ffc1a1dc1e.png

扫码参与

1ab5d7b941a2ef42f3266f2103814e93.png一起“赞”三连

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值