近期学习内容:基础机器学习概念如过拟合与欠拟合,线性回归,优化器,梯度下降法,多层感知机等
学习基本的文本处理技术,语言模型和循环神经网络
学习中的薄弱项:softmax和多层感知机函数的概念混淆
对于各种语言模型区别的认识混响,对于细节概念的忽视
对神经网络矩阵乘法概念的模糊
部分学习笔记:
random.shuffle()打乱数据
softmax:离散值预测,种类预测,适合于如图像分类任务
输出层对应类别可能性
输出概率和为1
不改变预测类别的输出
交叉熵:仅关心正确类别预测概率
num_work工作线程
验证data用以得model超参
测试data测model效果
多层linear regression 叠加仍为单层可表达
——仅为仿射变换affine transformation,多个仿射叠加仍为仿射
解决:引入非线性变换,即激活函数
激活函数三种:relu,sigmoid,tanh
对应的值域各相同,relu简单常用,适合层数多时
sigmoid适合分类问题
代码的具体实现:待完成!!!电脑编程出现了一些问题,截至日期:2.20