寒假组队学习计划!

Datawhale团队推出寒假组队学习计划,涵盖数据分析、编程实践(LeetCode腾讯精选)、异常检测和自然语言处理(知识图谱)四大主题。学习内容包括数据科学库使用、算法实践、异常检测方法和知识图谱操作,旨在提升学习者在各自领域的技能。每个主题设有详细的任务路线和学习周期,参与者将通过讨论和实践共同进步。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

↑↑↑关注后"星标"Datawhale

每日干货 & 每月组队学习,不错过

 Datawhale学习 

开源贡献:Datawhale团队

今年最后一次组队学习,包含数据分析、编程实践(LeetCode腾讯精选练习50)、异常检测、自然语言处理(知识图谱)四个内容的路线学习,参与学习需要有一些Python基础。

关于开源

Datawhale作为开源组织,更多是希望营造互促的学习氛围和纯粹的学习环境,所有学习内容和学习规划都将开源在Datawhale Github上,方便大家有监督和无监督学习,从而帮助到更多学习者成长。

开源内容

截止今日,Datawhale已经近开源30多门学习内容,涉及编程、数据挖掘、cv、nlp、强化学习和推荐系统六大模块,这来自每一个开源贡献者的参与。

开源地址

https://github.com/datawhalechina/team-learning

组队学习

关于组队学习,顾名思义,就是一群志同道合的小伙伴聚集一起,一起学习,一起讨论,一起组队打boss,一起克服拖延症。其实没有老师,没有教学,有的是一群热爱学习和渴望改变的小伙伴,交流学习,互促共进。

开源学习

1 /数据分析(学术前沿趋势分析)

开源贡献:刘羽中、杨毅远、张晋、雷钲仪、周郴莲、宋怡然、姚童

组队学习说明

    本次新人赛是Datawhale与天池联合发起的零基础入门系列赛事第五场 —— 零基础入门数据分析之学术前沿趋势分析。

    赛题以数据分析为背景,要求选手使用公开的arXiv论文完成对应的数据分析操作。与之前的数据挖掘赛题不同,本次赛题不仅要求选手对数据进行建模,而且需要选手利用赛题数据完成具体的可视化分析。

    为更好的引导大家入门,我们同时为本赛题定制了系列学习方案,其中包括数据科学库使用(Pandas、Numpy和Matplotlib)、数据分析介绍和数据分析工具使用三部分。通过对本方案的完整学习,可以帮助掌握数据分析基本技能。同时我们也将提供专属的视频直播学习通道。

任务路线:论文数据统计 -> 论文作者统计 -> 论文代码统计 -> 论文种类分类 -> 作者信息关联

组队学习周期:15天

学习名额:上限200人

定位人群:熟悉数据挖掘的基本方法,对学习数据分析掌握比赛技巧有需求的学习者。难度系数中

每个任务完成大概所需时间:3-5h

任务预览(3天)

Task04:论文种类分类(3天)

  • 学习主题:论文种类分类(数据建模任务),利用已有数据建模,对新论文进行类别分类;

  • 学习内容:使用论文标题完成类别分类;

  • 学习成果:学会文本分类的基本方法、TFIDF等;

2 /编程实践(LeetCode 腾讯精选练习50)

开源贡献:姚行志,韩绘锦,徐韬,马燕鹏

组队学习说明:每天刷三道题,利用20天完成Leetcode腾讯精选练习50题,主动讨论并总结。

任务路线:每天三道算法题,期间包含讨论总结环节。

组队学习周期:20天

学习名额:上限100人

定位人群:编程语言学习者,难度系数中

每个任务完成大概所需时间:3-5h

任务预览(1天)

Task03:完成以下三个题目并打卡(1天)

  • 011 盛最多水的容器

  • 014 最长公共前缀

  • 015 三数之和

注释:考虑到一天三道题的强度较高,本次学习安排了讨论总结环节,以便学习者回顾、总结和调整。

3 /数据挖掘(异常检测)

开源贡献:梁家晖,李玲,李芝翔,赵可,陈信达

组队学习说明:理解传统的异常检测方法原理,并具备基本的调用相应python库进行操作的能力。

任务路线:异常检测介绍、基于统计学的方法、线性模型、基于相似度的方法等。

组队学习周期:14天

学习名额:上限100人

定位人群:熟悉数据挖掘的基本方法,对学习异常检测算法有需求的学习者。难度系数中

每个任务完成大概所需时间:3-5h

任务预览(3天)

Task02:基于统计学的方法(3天)

  • 掌握基于高斯分布的异常检测方法

  • 理解非参数异常检测方法

  • 掌握HBOS算法

4 /自然语言处理实践(知识图谱)

开源贡献:吴晓均、杨开漠、康兵兵,周郴莲,王翔,超逸,王嘉鹏,陈安东,段秋阳

组队学习说明:理解知识图谱的基本原理,熟悉Neo4j并具备基本的调用相应python库进行操作的能力。

任务路线:知识图谱介绍、基于医疗知识图谱的问答系统操作介绍、Neo4j图数据库导入数据等。

组队学习周期:8天

学习名额:上限100人

定位人群:熟悉自然语言处理基本方法,对学习知识图谱算法有需求的学员。,难度系数中

每个任务完成大概所需时间:3-5h

任务预览(1天)

Task02:基于医疗知识图谱的问答系统操作介绍(1天)

  • 引言

  • 运行环境

  • 搭建知识图谱

  • 启动问答测试

  • 代码目录介绍

参与学习

快速通道

  1. 【数据分析之学术前沿趋势分析】开源地址
    https://github.com/datawhalechina/team-learning-data-mining/tree/master/AcademicTrends

  2. 【编程实践】 开源地址
    https://github.com/datawhalechina/team-learning-program/tree/master/LeetCodeTencent

  3. 【异常检测】 开源地址
    https://github.com/datawhalechina/team-learning-data-mining/tree/master/AnomalyDetection

  4. 【知识图谱】 开源地址
    https://github.com/datawhalechina/team-learning-nlp/tree/master/KnowledgeGraph_Basic

  5. 【Datawhale论坛】本期详细学习安排
    论坛链接:http://datawhale.club/t/topic/1012

学习规则

  1. 需交督促金3块:1块学习,1块分享,1块成长;

  2. 需要有一个可以记录学习的公开帐号;

  3. 根据任务安排学习,完成后写学习笔记blog

  4. 任务截止前在群内打卡,遇到问题一起交流讨论;

  5. 未按时打卡的同学视为自动放弃,流出学习群。

报名方式

1月9日(周六)中午12:00 在Datawhale社群(高校群和在职群)分享报名二维码,组织学习非盈利,精力有限,没有报上名的可以根据开源教程自行安排学习。

最后,未在社群的小伙伴,可在公众号后台回复关键词“在校”或“在职”进群。(已在的不需要重复加入!)直接获得名额:

分享获赞满30个或最用心留言10个



“为开源学习点赞

⬇️ 详细查看【寒假组队学习安排】

<think>好的,我现在需要帮助用户解决如何提高保研概率的问题,尤其是他现在专业排名第二的情况下。首先,我需要回顾之前的对话历史,看看用户之前已经询问过湖南科技大学信息学院的保研建议,并且得到了详细的回复。现在用户的具体情况是专业排名第二,想知道如何进一步提高保研概率。 首先,用户当前排名已经很靠前,但可能担心竞争激烈或者想冲刺更好的学校。我需要考虑在现有基础上还能优化的地方。根据之前的建议,绩点和排名是关键,但用户已经是第二,所以可能需要巩固现有成绩,同时提升其他方面,比如竞赛、科研、英语等。 接下来,用户的需求可能不仅仅是维持排名,而是如何在现有基础上增加竞争力,尤其是针对目标院校的要求。需要分点列出具体的策略,比如巩固学业、竞赛突破、科研提升、材料准备等。 还要考虑用户可能的潜在需求,比如是否需要联系导师、如何选择夏令营、面试准备等。此外,用户可能对保研流程中的时间节点不太清楚,需要提醒关键时间,比如大三下学期的准备,夏令营申请等。 需要确保建议具体可行,例如在竞赛方面推荐适合信息学院学生的比赛,科研方面如何寻找导师项目,如何准备推荐信和个人陈述。同时,提醒用户关注政策变化,准备备选方案,比如同步准备考研,以防万一。 最后,语言要口语化,结构清晰,分点明确,让用户容易理解和执行。需要检查是否有遗漏的重要点,比如英语成绩的重要性,或者实践项目的建议。确保每个建议都有实际操作性,比如具体提到GitHub项目、专利申请等细节。</think>以下是针对专业排名第二的学生提升保研成功率的进阶策略,结合信息学院特点给出具体建议: --- ### **一、巩固学业优势(核心基础)** 1. **精准控分策略** - 重点保护核心课程(如:$90+$的《算法设计与分析》《数字信号处理》) - 使用《课程成绩预测表》测算后续课程对GPA影响,优先保障学分高的必修课 - 关注课程设计(如《嵌入式系统设计》),争取获评优秀作品 2. **差异化竞争** - 在专业细分方向建立标签(如:强化"机器学习算法优化"或"FPGA开发"方向课程优势) - 选修研究生先修课(如《矩阵分析》《机器学习数学基础》) --- ### **二、竞赛突破策略(关键加分)** 1. **重点赛事建议** | 赛事类型 | 推荐赛事 | 建议组队时间 | |----------------|---------------------------|-----------------| | 算法类 | ACM-ICPC亚洲区域赛 | 大三上学期组队 | | 综合类 | 全国大学生电子设计竞赛 | 大二暑期开始备赛 | | 数学类 | 数学建模美赛(MCM/ICM) | 大二寒假参赛 | 2. **备赛技巧** - 针对算法竞赛:每日坚持LeetCode/PAT甲级题库训练 - 电子设计类:提前掌握Altium Designer和STM32开发 - 数学建模:建立常用算法库(如灰色预测模型$GM(1,1)$) --- ### **三、科研能力提升(决胜关键)** 1. **科研路径选择** - 优先参与学院重点实验室项目(如:智能信息处理实验室) - 尝试在CCF-C类会议发表论文(如ICMLC、ICNC) - 申请实用新型专利(平均周期6-8个月) 2. **科研工具准备** - 掌握LaTeX论文排版(推荐使用Overleaf平台) - 学习科研绘图(Origin/Matplotlib) - 建立个人学术博客(记录科研笔记) --- ### **四、目标院校攻坚** 1. **夏令营策略** ```python # 目标院校梯度建议(以计算机方向为例) target_schools = { "冲刺档": ["清华大学(深圳)", "浙江大学(工程师学院)"], "主申档": ["华中科技大学", "电子科技大学"], "保底档": ["中南大学(人工智能研究院)", "本校优培计划"] } ``` 2. **材料优化重点** - 个人陈述突出科研贡献(如:"提出改进的$LSTM$模型,预测准确率提升12.3%") - 推荐信争取获得省级以上人才称号的教授签名 - 准备技术作品集(含代码仓库链接、电路设计图、Demo视频) --- ### **五、风险控制方案** 1. **双轨制准备** $$P(保研成功) = 1 - \prod_{i=1}^n (1 - p_i)$$ (其中$p_i$代表各备选路径成功率) - 同步准备1-2门考研专业课(如《数据结构》《计算机网络》) - 维持英语持续学习(建议托福每周模考1次) 2. **关键时间轴** ``` 大三下(3月):联系目标院校导师 大三下(5月):参营论文终稿完成 大四上(9月):准备3套面试应急预案 ``` --- **特别提醒**: 1. 关注学院《推免细则》中"综合成绩=学业成绩×80%+发展性素质×20%"的具体算法 2. 建议每周与1位已保研学长交流(重点获取面试真题) 3. 准备5分钟英文自我介绍(含专业术语双语对照表) 当前排名已具备较强竞争力,重点应转向提升科研产出和院校匹配度。建议每月进行一次SWOT分析,动态调整备战策略。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值