只考虑二阶特征的情况下,对one-hot编码后的数据通过逻辑回归实现二分类
接下来,与线性拟合类似,进行参数估计与损失值计算,不同的是线性模型是采用最小二乘估计,而逻辑回归模型是采用最大似然估计,即分类正确的概率最大的情况下,求解参数,似然函数是一个关于参数的函数。假设有5个样本(样本数为n),一阶特征有2个,性别和爱好,其中性别特征有男女2种,爱好有4种,那么二阶特征有8种(2*4),那么训练数据X的维度应该是5*8。对于这个二分类任务,y的取值只有0和1两种,p(y=1)=sigmoid(w.x),p(y=0)=1-p(y=1),,其中幂指数是该事件发生时的真实值。
原创
2024-09-05 15:13:28 ·
466 阅读 ·
0 评论