【数据竞赛】“达观杯”文本智能处理挑战赛１

原创于 2019-04-05 17:16:09 发布 · 181 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#文本分类

本文介绍了如何使用Python的pandas库来读取训练集和测试集数据，并利用sklearn库进行数据划分，以便进行后续的机器学习模型训练与验证。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一读取数据

import pandas as pd
from sklearn.model_selection import train_test_split

# 读取数据
df_train = pd.read_csv('./new_data/train_set.csv',index_col='id')
test_data = pd.read_csv('./new_data/test_set.csv',index_col='id')
train_data = df_train.drop(['class'],axis=1)
train_lable = df_train['class']

数据划分

X_train,X_test,Y_train,Y_test =  train_test_split(train_data, train_lable, test_size=0.3, random_state=2019)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

孙大壮实

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Python-达观杯文本智能处理挑战赛文本分类任务的实现

08-11

在本项目"Python-达观杯文本智能处理挑战赛文本分类任务的实现"中，我们主要探讨了如何利用Python编程语言以及相关的机器学习和深度学习库来解决文本分类问题。文本分类是自然语言处理（NLP）领域的一个关键任务，其...

cpp-2018年达观杯文本智能处理挑战赛长文本分类rank4

08-16

【标题】"cpp-2018年达观杯文本智能处理挑战赛长文本分类rank4"揭示了这个项目是关于使用C++编程语言在2018年的“达观杯”文本智能处理挑战赛中，针对长文本分类任务的一个解决方案，并且在比赛中取得了第四名的成绩...

参与评论您还未登录，请先登录后发表或查看评论

达观杯文本智能处理挑战赛参赛源码+说明.zip

03-20

《达观杯文本智能处理挑战赛参赛源码及说明》简介 “达观杯文本智能处理挑战赛参赛源码 + 说明.zip”是一份极具价值的学习资源。该资源围绕达观杯这一具有影响力的文本智能处理挑战赛展开，其中包含参赛团队精心...

天池竞赛o2o优惠券使用预测算法源码（达观杯文本智能处理挑战赛）.zip

03-20

“天池竞赛o2o优惠券使用预测算法源码（达观杯文本智能处理挑战赛）.zip”资源，是针对达观杯文本智能处理挑战赛中关于o2o优惠券使用预测的珍贵学习资料。该源码围绕o2o优惠券使用预测这一核心任务展开，融合了...

天池竞赛o2o优惠券使用预测与达观杯文本智能处理挑战赛.zip

11-09

该课题为基于Matlab的神经网络汉字识别系统。是用bp神经网络。带有一个人机交互界面，输入测试图片，进行预处理，读取隐含层等信息，进行信息识别的输出。.zip

08-21

该课题为基于Matlab的运动目标跟踪系统。可以实时框定运动目标。对运动目标的行为做识别。带有人机交互界面，需要在人机交互界面的基础上进行拓展(4).zip

08-21

基于Matlab的数字水印系统

08-21

基于Matlab的数字水印系统

range-v3-devel-0.11.0-4.el8.tar.gz

08-21

# 适用操作系统：Centos8 #Step1、解压 tar -zxvf xxx.el8.tar.gz #Step2、进入解压后的目录，执行安装 sudo rpm -ivh *.rpm

计图大模型推理库，具有高性能、配置要求低、中文支持好、可移植等特点

【数据竞赛】“达观杯”文本智能处理挑战赛１

一 读取数据

数据划分

一读取数据