
数据竞赛
张贤同学
在读研究生,热爱技术,做过Android、嵌入式。现在研究但不限于:java、Android、Deep Learning、GCN。
联系邮箱:zhangxian_tech@163.com
博客地址:blog.zhangxiann.com
公众号:【张贤同学】
展开
-
阿里天池 NLP 入门赛 Bert 方案 -3 Bert 预训练与分类
前言这篇文章用于记录阿里天池 NLP 入门赛,详细讲解了整个数据处理流程,以及如何从零构建一个模型,适合新手入门。赛题以新闻数据为赛题数据,数据集报名后可见并可下载。赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分出 14 个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐的文本数据。实质上是一个 14 分类问题。赛题数据由以下几个部分构成:训练集 20w 条样本,测试集 A 包括 5w 条样本,测试集 B 包括 5w 条样本。比赛地址:htt原创 2020-09-06 09:35:52 · 1336 阅读 · 0 评论 -
阿里天池 NLP 入门赛 Bert 方案 -2 Bert 源码讲解
前言这篇文章用于记录阿里天池 NLP 入门赛,详细讲解了整个数据处理流程,以及如何从零构建一个模型,适合新手入门。赛题以新闻数据为赛题数据,数据集报名后可见并可下载。赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分出 14 个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐的文本数据。实质上是一个 14 分类问题。赛题数据由以下几个部分构成:训练集 20w 条样本,测试集 A 包括 5w 条样本,测试集 B 包括 5w 条样本。比赛地址:htt原创 2020-09-06 09:31:58 · 1162 阅读 · 0 评论 -
阿里天池 NLP 入门赛 Bert 方案 -1 数据预处理
前言这篇文章用于记录阿里天池 NLP 入门赛,详细讲解了整个数据处理流程,以及如何从零构建一个模型,适合新手入门。赛题以新闻数据为赛题数据,数据集报名后可见并可下载。赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分出 14 个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐的文本数据。实质上是一个 14 分类问题。赛题数据由以下几个部分构成:训练集 20w 条样本,测试集 A 包括 5w 条样本,测试集 B 包括 5w 条样本。比赛地址:htt原创 2020-09-06 09:25:31 · 1629 阅读 · 0 评论