【Task1 数据集探索 (2 days)】
1.数据集
数据集:中、英文数据集各一份
中文数据集:THUCNews
英文数据集:IMDB数据集 Sentiment Analysis
http://ai.stanford.edu/~amaas/data/sentiment/
2.影评文本分类官方学习文档
https://tensorflow.google.cn/tutorials/keras/basic_text_classification
3.THUCNews数据集下载和探索
参考博客中的数据集部分和预处理部分:
https://blog.youkuaiyun.com/u011439796/article/details/77692621
参考代码:https://github.com/gaussic/text-classification-cnn-rnn/blob/master/data/cnews_loader.py
4.学习召回率、准确率、ROC曲线、AUC、PR曲线这些基本概念
参考1:https://www.imooc.com/article/48072
**
【准备任务】
**
1.tensorflow安装
2.tensrflow基础(划重点)
关注图、会话、tensor、变量、feed和fetch;
使用图(graphs)来表示计算任务、在被称之为会话(Session)的上下文(context)中执行图、使用tensor表示数据、通过变量(Variable)维护状态;
使用feed和fetch为任意的操作赋值或者从其中获取数据。
参考:
TENSORFLOW从入门到精通之——TENSORFLOW基本操作 http://www.tensorflownews.com/2018/03/28/tensorflow_base/
tensorflow简介
http://wiki.jikexueyuan.com/project/tensorflow-zh/get_started/introduction.html
tensorflow基本使用 http://wiki.jikexueyuan.com/project/tensorflowzh/get_started/basic_usage.html
莫凡tensorflow(学习中…)
https://morvanzhou.github.io/tutorials/machine-learning/tensorflow/
史上最全的Tensorflow学习资源汇总
https://zhuanlan.zhihu.com/p/35515805
【后续任务】
1.熟悉tensorflow用法
2.尝试多种数据集处理