
nlp竞赛
leo_weile
这个作者很懒,什么都没留下…
展开
-
DataFountain-互联网新闻情感分析Baseline篇
赛题背景随着各种社交平台的兴起,网络上用户的生成内容越来越多,产生大量的文本信息,如新闻、微博、博客等,面对如此庞大且富有情绪表达的文本信息,完全可以考虑通过探索他们潜在的价值为人们服务。因此近年来情绪分析受到计算机语言学领域研究者们的密切关注,成为一项进本的热点研究任务。本赛题目标为在庞大的数据集中精准的区分文本的情感极性,情感分为正中负三类。面对浩如烟海的新闻信息,精确识别蕴藏在其中的情...原创 2019-09-05 15:38:29 · 6306 阅读 · 7 评论 -
DataFountain-互联网新闻情感分析fasttext篇
fasttext版本0.9.1 参考文本分类官方教程:https://fasttext.cc/docs/en/supervised-tutorial.html数据集格式" ".join(["__label__classId"]+["我们","中国"]),标签用特定的__label__连接,和分词共同使用空格分割拼接在一起。官方给的参考数据下载地址:https://dl.fbaipu...原创 2019-09-07 10:45:04 · 1035 阅读 · 0 评论 -
基于pandas实现K折交叉验证数据集划分
k折交叉验证将训练集分为k份,取其中一份成为验证集,剩下成为训练集,称为k折数据划分,使用得到的k个训练集、验证集,训练k个模型,k个模型做简单的模型融合,可提升模型稳定性、准确率。数据介绍数据共有四列,列名分别为id,title,content,id,抽样了20行方便进行试验。代码实现#以下代码得到上图的数据train=pd.read_csv("data_0/tr...原创 2019-09-23 14:36:24 · 4998 阅读 · 0 评论 -
pytorch gpu变成常用命令
官方文档:https://pytorch.org/docs/stable/cuda.html0、设备命名:cpu,cuda:0(0代表gpu编号),......,cuda:n1、测试gpu是否可用:torch.cuda.is_available()2、返回gpu可用数量:torch.cuda.device_count()3、默认选择某一个gpu,若不存在,使用cpu:device ...原创 2019-09-30 11:23:44 · 713 阅读 · 0 评论