2025 iFLYTEK AI开发者大赛&Datawhale AI夏令营:新增用户预测挑战赛

本次参加的比赛为科大讯飞的新增用户预测挑战赛

一、背景

科大讯飞主办的一项数据科学竞赛,旨在通过机器学习方法预测用户是否为新增用户

比赛属于二分类任务,评价指标采用F1分数,分数越高表示模型性能越好。

行业价值:
精准预测用户增长趋势,优化产品迭代方向
降低用户获取成本,提高营销转化率
为AI能力落地提供量化评估依据

技术价值:
解决实际业务场景中的用户增长预测问题
验证AI在用户行为分析领域的有效性
建立可复用的用户增长预测方法论

二、数据介绍

参与算法赛事,一定要仔细理解赛事的 输入-输出 究竟是什么,尤其是提交的格式。

三、baseline以及优化baseline

import pandas as pd
import numpy as np
import json
import lightgbm as lgb
from sklearn.model_selection import StratifiedKFold
from sklearn.metrics import f1_score
from sklearn.preprocessing import LabelEncoder
import warnings
warnings.filterwarnings('ignore')


# 1. 数据加载
train_df = pd.read_csv('./train.csv')
test_df = pd.read_csv('./testA_data.csv')
submit = test_df[['did']]

full_df = pd.concat([train_df, test_df], axis=0)

# 2. 时间特征工程
for df in [train_df, test_df, full_df]:
    # 转换为时间戳
    df['ts'] = pd.to_datetime(df['common_ts'], unit='ms')
    # 提取时间特征
    df['day'] = df['ts'].dt.day
    df['dayofweek'] = df['ts'].dt.dayofweek
    df['hour'] = df
### iFLYTEK A.I. 开发者大赛讯飞开放平台赛题介绍 #### 赛事背景与目标 科大讯飞举办的iFLYTEK A.I.开发者大赛旨在挖掘优秀的人工智能技术人才,通过一系列具有挑战性的赛题来推动人工智能领域的发展。此次比赛提供了多个赛道供参赛者选择,其中基于星火大模型的群聊对话分角色要素提取挑战赛是一个重要组成部分[^2]。 #### 参赛流程概述 对于希望参加主赛场比赛的选手来说,需要访问官方指定网站——「2023 iFLYTEK A.I.开发者大赛」完成在线注册并正式报名。在整个过程中,请确保所有操作都在该平台上进行,包括但不限于提交最终的作品成果。此外,针对特定类型的竞赛项目,比如涉及大模型微调的任务,则还需要额外登录至专门设立的讯飞大模型定制训练平台开展进一步的工作[^1]。 #### 技术要求说明 本次竞赛特别强调了对大模型微调能力的应用,具体而言就是期望各支队伍能够利用所提供的资源和技术支持,在给定的数据集基础上调整预训练好的大型语言模型参数,使其更好地适应高中阶段语文科目中的现代文以及英文阅读材料的理解需求。这不仅考验着参赛者的算法设计水平,同时也对其工程实现提出了较高标准。值得注意的是,主办方已经准备好了必要的基础设施和服务环境,以便让每一个参与者都能专注于核心问题的研究而不必担心计算资源等问题带来的困扰。 #### 奖励机制描述 为了吸引更多优秀的个人或团体加入这场盛会之中,除了提供良好的竞技舞台外,还设立了丰厚的资金奖励和其他形式的支持措施。例如,“百万奖金”的承诺无疑是对那些渴望展示自我实力的技术爱好者的巨大吸引力之一;而在此之前所积累的良好口碑也使得越来越多来自不同背景的年轻人愿意参与到这项活动中来,共同探索未知的知识海洋[^3]。 ```python # 示例代码用于模拟如何连接到API获取数据 import requests def get_data_from_api(url, params=None): response = requests.get(url, params=params) if response.status_code == 200: return response.json() else: raise Exception(f"Failed to fetch data with status code {response.status_code}") api_url = "https://example.com/api/v1/data" params = {"key": "value"} data = get_data_from_api(api_url, params) print(data) ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值