安徽省大数据竞赛反思与总结

通过7月份的组队报名,三个月的学习下,我和两位学姐进入决赛参加比赛。

比赛赛制:1.通过网络赛的筛选,选择60%的队伍进入现场赛

2.网络赛为6个小时,现场赛为四个小时

网络赛归纳总结:

1.因为一直学的是Python预处理、可视化。所以本来是负责预处理部分和可视化部分。但是看到题后,发现预处理需要用mapreduce做,所以这部分是学姐帮我做的,而我变成负责可视化和综合题。

2.在做可视化题中,发现了很多以前学习是没有发现的学习漏洞,比如将柱状图与折线图放在一张图上,形成两列y值。可能是因为在本院实验室,环境没有带给我影响,反而让我冷静了许多,然后就立刻寻找此类案例,后来根据多次调试运行出了结果。顿时觉得平时的知识储量是狭隘的。这应该也是网络赛带给我很突出的一个帮助。

3.在做综合题时,题目很具鲜活性,但是数万条数据在处理中会做着做着中就没思路了,证明数据处理需要建立在数万条数据上。数据过少会失去原有的错误发生机会。

现场赛:

1.因为比赛过程中只能携带纸质材料,所以在学习过程中一直在总结案例,后来比赛前发现我还是总结的不够多,在看到题目与曾见过的一道题相似,却不记得具体做法后,心态是有些崩的,证明以后要学一道就记住一道。

2.在比赛开始时,网络平台无法进入,两个小时以后才开始比赛,这段时间,我见到了很多画面,有的队伍在继续看资料,有的队伍在聊天埋怨,这是比赛时每个人不同的心态,也会决定每个人的耐心和专注力(我和学姐们看资料了嘞!)

3.在现场赛才会遇到的错误就是,在实验室运行这段代码就没有问题,但在现场赛的电脑上运行就会出现不同、多样的错误。这导致我浪费了很多时间去调试,最后没有调试成功,我就再用其他办法运行。

4.可视化第二题的多图放在一张图上的问题,也是我平时学习没有遇到的,所以未来的学习中,我需要多多积累,学会创新,等明年我作为学姐带学弟学妹们比赛的时候,那时候一定要是一个准备了一年的我!好好努力!好好加油!

5.比赛中使用的键盘很难敲,不是自己熟悉的键盘,所以需要熟悉 不同的键盘 不同的电脑配置环境 不同的外部环境。总的来说,这次比赛给了我很大的帮助,在思想上

安徽省大数据人工智能应用竞赛是一项面向高校学生、旨在提升大数据人工智能领域实践能力的赛事。此类竞赛通常聚焦于数据挖掘、机器学习、深度学习、自然语言处理、计算机视觉等前沿技术,鼓励学生结合实际问题进行创新性应用开发。竞赛题目往往来源于企业真实业务场景或科研项目,具有较强的实用性和挑战性。 从竞赛内容来看,通常包括以下几个方面: 1. **数据处理分析**:参赛者需要对给定的大数据集进行清洗、预处理、特征提取等操作,为后续建模分析打下基础。 2. **模型构建优化**:基于具体任务,使用合适的机器学习或深度学习算法构建预测或分类模型,并通过调参提升模型性能。 3. **应用场景实现**:将人工智能技术应用于特定领域,如金融风控、智慧城市、医疗健康、推荐系统等,强调技术落地的实际价值。 4. **创新创意展示**:鼓励学生在项目中体现创新思维,提出新的解决方案或改进现有方法。 竞赛形式通常为团队参赛,要求提交完整的项目报告可运行的代码,并进行现场答辩。评审标准包括技术难度、创新性、实用性以及团队协作能力等。 为了更好地准备此类竞赛,建议参考以下资源和方法: - **历年竞赛题目**:可以通过高校官网、竞赛官方网站或相关论坛获取历届竞赛题目优秀作品,了解命题趋势评分标准。 - **开源平台数据集**:Kaggle、阿里天池、DataFountain 等平台上提供了大量大数据和人工智能相关的竞赛题目及数据集,适合练习提升实战能力。 - **技术文档论文**:深入阅读相关领域的论文和技术博客,掌握最新的算法工具,例如 TensorFlow、PyTorch、Scikit-learn 等主流框架的使用方法。 以下是一个简单的机器学习代码示例,使用 Scikit-learn 构建一个分类模型: ```python from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import accuracy_score # 加载数据集 iris = load_iris() X, y = iris.data, iris.target # 划分训练集测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) # 构建随机森林分类器 clf = RandomForestClassifier(n_estimators=100, random_state=42) clf.fit(X_train, y_train) # 进行预测 y_pred = clf.predict(X_test) # 计算准确率 accuracy = accuracy_score(y_test, y_pred) print(f"模型准确率: {accuracy:.2f}") ``` 该代码展示了从数据加载、模型训练到评估的基本流程,适用于初学者理解机器学习的基本概念实现方式。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值