第六届“泰迪杯”数据分析技能赛获奖成绩公示

2023年的全国技能大赛于9月至11月举行,吸引了300所高校的1638支队伍参赛。采用盲审机制,最终公示了一等奖及泰迪杯的详细名单,包括专科和本科及以上组别,获奖者及其指导教师的详情在数睿思平台上可查询。

获奖名单公示

本届技能赛于2023年9月9日正式开始,至2023年11月12日结束,历时两个半月。技能赛共计有来自全国近300所高校的1638支队伍报名参赛,由高校和公司共同组成的评审专家组历时半个月的盲审。

本届竞赛采用盲审(屏蔽参赛者信息;两位评阅专家同时评阅同一作品,超限调整后再取平均分)。

各奖项证书参赛者及指导老师每人一份,证书为电子版,各奖项证书颁奖会结束后(12月11日)可在“获奖证书”页面下载。成功参赛名单在本页面尾部下载。

本届评审专家名单(排名不分先后):

姓名

单位

姓名

单位

蔡志杰

复旦大学

冯国灿

中山大学

杨   坦

<
### 泰迪数据分析技能 B 题概述 #### 比背景与目标 第六届泰迪数据分析技能旨在通过实际案例提升参者的数据分析能力。B题聚焦于银行客户忠诚度分析,具体涉及短期客户产品购买数据`short-customer-data.csv`和长期客户资源信息数据的训练集`long-customer-train.csv`[^3]。 #### 数据描述 - 记录了客户的短期行为特征及其所购产品的详细情况。 - **长期客户资源信息数据 (`long-customer-train.csv`)** - 提供了关于客户的长时间跨度内的交易记录和其他相关信息,用于建立预测模型的基础数据源。 #### 参要求 参与者需完成以下任务: 1. 对给定的数据集执行全面的数据清洗工作; 2. 进行探索性数据分析(EDA),识别潜在模式并发现异常值; 3. 构建合适的统计或机器学习模型来进行客户忠诚度评估; 4. 使用图表等形式直观展示研究结论,并撰写报告说明方法论和技术细节; #### 解题思路 针对此问题,建议采用如下策略: ##### 数据预处理阶段 ```python import pandas as pd # 加载数据文件 df_short = pd.read_csv('short-customer-data.csv') df_long_train = pd.read_csv('long-customer-train.csv') # 查看前几行以了解结构 print(df_short.head()) print(df_long_train.head()) # 处理缺失值、重复项等问题... ``` ##### 探索性数据分析 (EDA) 利用可视化工具如Matplotlib, Seaborn等绘制直方图、箱线图等图形帮助理解变量分布特性及相互关系。 ##### 特征工程 基于业务逻辑创建新特征,比如计算每位顾客平均消费金额、最近一次访问间隔天数等指标作为输入到后续建模过程中的额外维度。 ##### 建立预测模型 可以选择多种算法尝试,例如决策树、随机森林和支持向量机等分类器来判断哪些因素最有可能影响客户的忠诚度水平。 ##### 结果解释与优化 最终选定表现最佳的一个或多个月模型组合起来形成综合评分体系,并据此提出改进建议帮助企业提高服务质量从而增强用户的粘性和满意度。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值