
比赛
flying_1314
2025持续分享前沿文章~敬请期待~
展开
-
Task03——零基础入门NLP - 基于机器学习的文本分类
学习目标学会TF-IDF使用原理 使用sklearn的机器学习模型完成文本分类文本表示方法one-hot bag of words N-grams TF-IDF基于机器学习的文本分类代码原创 2020-07-27 22:42:11 · 132 阅读 · 0 评论 -
Task04——零基础入门NLP - 基于深度学习的文本分类1
学习目标学习fasttext使用和基本原理 学会使用验证集进行调参原创 2020-07-27 22:35:58 · 167 阅读 · 0 评论 -
Task02——零基础入门NLP - 新闻文本分类之数据读取与分析
本期目标学习使用Pandas读取赛题数据 分析赛题数据的分布规律数据读取import pandas as pdtrain_df=pd.read_csv('./train_set.csv/train_set.csv',sep='\t',nrows=100)train_df.head()这里的read_csv由三部分构成:读取的文件路径,这里需要根据改成你本地的路径,可以使用相对路径或绝对路径; 分隔符sep,为每列分割的字符,设置为\t即可; 读取行数nrows,为此次读取文件的原创 2020-07-22 22:15:15 · 431 阅读 · 0 评论 -
Task01——零基础入门NLP - 新闻文本分类之赛题理解
本篇目标首先本篇文章会对赛题进行介绍以及个人对赛题的理解,带大家接触NLP的预处理、模型构建和模型训练等知识点。赛题介绍赛题名称:零基础入门NLP - 新闻文本分类赛题任务:赛题以自然语言处理为背景,要求选手对新闻文本进行分类,这是一个典型的字符识别问题赛题数据:赛题以匿名处理后的新闻数据为赛题数据,数据集报名后可见并可下载。赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐原创 2020-07-21 17:25:09 · 223 阅读 · 0 评论