
新闻文本分类
一起来玩鸭
这个作者很懒,什么都没留下…
展开
-
Datawhale零基础入门NLP赛事 - Task2 数据读取与数据分析
在上一章节,我们给大家简单介绍了赛题的内容和几种解决方案。从本章开始我们将会逐渐带着大家使用思路1到思路4来完成本次赛题。在讲解工具使用的同时,我们还会讲解一些算法的原理和相关知识点,并会给出一定的参考文献供大家深入学习。 Task2 数据读取与数据分析 本章主要内容为数据读取和数据分析,具体使用Pandas库完成数据读取操作,并对赛题数据进行分析构成。 学习目标 学习使用Pandas读取赛题数据 分析赛题数据的分布规律 数据读取 赛题数据虽然是文本数据,每个新闻是不定长的,但任然使用csv格式进行存储。因原创 2020-07-22 22:43:57 · 110 阅读 · 0 评论 -
Datawhale零基础入门NLP赛事 - Task1 赛题理解
新闻文本分类——天池 本章将会对新闻文本分类进行赛题讲解,对赛题数据进行说明,并给出解题思路。 赛题理解 赛题名称:零基础入门NLP之新闻文本分类 赛题目标:通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触NLP的预处理、模型构建和模型训练等知识点。 赛题任务:赛题以自然语言处理为背景,要求选手对新闻文本进行分类,这是一个典型的字符识别问题。 学习目标 理解赛题背景与赛题数据 完成赛题报名和数据下载,理解赛题的解题思路 赛题数据 赛题以匿名处理后的新闻数据为赛题数据,数据集报名后可见并可下载。赛题原创 2020-07-22 22:32:40 · 156 阅读 · 2 评论