
机器学习
lsjmax
这个作者很懒,什么都没留下…
展开
-
特征工程
目录特征工程数据预处理1.数据缺失2.离散值连续化(数值化)(1)直接数值化(2)独特编码(one-hot encoding)(3)特征嵌入(embedding)3.连续值离散化(1)根据阀值进行分组(2)基于聚类分析的方法(3)采用决策树模型4.特征标准化和归一化(数值型特征)(1)零-均值标准化(Z-score)(2)归一化(3)L1/L2范数标准化功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右S原创 2020-10-12 21:22:50 · 359 阅读 · 0 评论 -
LSTM输入输出理解
LSTM单元计算图中虽然有3个LSTM单元,但是实际上只有一LSTM单元A,这里计算过程是假设输入的时间序列是3,则首先输入样本x0x_0x0,LSTM初始状态c0c_0c0,h0h_0h0得到LSTM的状态c1c_1c1和h1h_1h1,此时在同一个LSTM单元输入x1x_1x1和c1c_1c1和h1h_1h1,得到c2c_2c2和h2h_2h2,在同一个LSTM单元输入...原创 2020-08-22 20:50:03 · 15570 阅读 · 0 评论 -
数据归一化、标准化和去中心化
数据预处理,一般有数据归一化、标准化和去中心化。归一化将数据映射到[0,1]或[-1,1]区间范围内,不同特征的量纲不同,值范围大小不同,存在奇异值,对训练有影响。标准化将数据映射到满足标准正态分布的范围内,使数据满足均值为0,标准差为1。标准化同样可以消除不同特征的量纲。去中心化使数据满足均值为0,但对标准差没有要求。每种方法对应的使用场景1.若对数据的范围没有限定要求,则选择标...原创 2020-02-17 23:03:45 · 9070 阅读 · 0 评论 -
感知机模型
感知机感知机时神经网络的雏形,是线性二分类器,输入实例的特征向量,输出1,-1进行实例的分类。感知机模型是寻找N维空间的超平面。(超平面是指将空间一分为二的平面,N维空间的超平面为N-1维,如二维平面的超平面是一条直线,三维空间的超平面是一个平面)。感知机模型的表示:f(x⃗)=sign(w⃗⋅x⃗+b)f(\vec{x})=sign(\vec{w} \cdot \vec{x}+b)f(x)...原创 2019-10-24 16:08:48 · 245 阅读 · 0 评论