
NLP
世界而世界
这个作者很懒,什么都没留下…
展开
-
【NLP入门】赛题1-新闻文本分类-Task5-基于深度学习的文本分类2-1Word2Vec
赛题1-新闻文本分类-Task5-基于深度学习的文本分类2-1Word2Vec本次任务四天完成赛题赛题讲解赛题数据讲解机器学习讲解深度学习-fastText深度学习-word2vec安装 pyTorch官网下载地址及安装说明跑程序先导入包import loggingimport randomimport numpy as npimport torchlogging.basicConfig(level=logging.INFO, format='%(asct原创 2020-07-31 13:33:13 · 654 阅读 · 0 评论 -
【NLP入门】赛题1-新闻文本分类-Task04-基于深度学习的文本分类1-fastText
赛题1-新闻文本分类-Task04-基于深度学习的文本分类1-fastText本次任务两天完成赛题赛题讲解赛题数据讲解机器学习讲解深度学习-fastText目标学习FastText的使用和基础原理学会使用验证集进行调参跑fasttext模型代码数据预处理# 引入 Pandasimport pandas as pd# 读取数据train_set = pd.read_csv('./data/1/train_set.csv', sep='\t', nrows=15000原创 2020-07-27 21:58:25 · 344 阅读 · 0 评论 -
【NLP入门】赛题1-新闻文本分类-Task03-基于机器学习的文本分类
赛题1-新闻文本分类-Task03-基于机器学习的文本分类本次任务三天完成赛题赛题讲解赛题数据讲解机器学习讲解使用机器学习跑模型试试读取数据# 引入 Pandasimport pandas as pd# 读取数据train_set = pd.read_csv('./data/1/train_set.csv', sep='\t')# 看一下数据的前几行train_set.head()基于机器学习的文本分类# Count Vectors + RidgeClassi原创 2020-07-25 21:58:05 · 272 阅读 · 0 评论 -
【NLP入门】赛题1-新闻文本分类-Task02-数据读取及初步分析
赛题1-新闻文本分类-Task02-数据读取及初步分析今天主要是代码向# 引入 Pandasimport pandas as pd# 读取数据train_set = pd.read_csv('./data/1/train_set.csv', sep='\t')# 看一下数据的前几行train_set.head()# 数据分析# 1 赛题数据中,新闻文本的长度是多少?# 2 赛题数据的类别分布是怎么样的,哪些类别比较多?# 3 赛题数据中,字符分布是怎么样的?# 句子长度分析t原创 2020-07-22 23:39:51 · 238 阅读 · 0 评论 -
【NLP入门】赛题1-新闻文本分类-Task01-赛题理解
赛题1-新闻文本分类-Task01-赛题理解赛题赛题讲解赛题环境安装下载 anaconda 地址现在官网就可以直接下载了目前我装的是 py3.7装好之后可以使用 jupyter 进行可视化开发1 读取数据# 引入 Pandasimport pandas as pd# 读取数据# 数据分隔符 \t# \t 水平制表(HT) (跳到下一个TAB位置)train_set = pd.read_csv('./data/1/train_set.csv', sep='\t')原创 2020-07-21 23:22:52 · 305 阅读 · 0 评论