Logistic回归可以被看成是一种概率估计。我们在每个特征上乘一个回归系数,然后所有值相加,总和带入sigmoid函数,得到一个0~1之间的数值,大于0.5的被分到1类,小于0.5的被分到0类别中。 一、理论基础 用Logistic回归进行分类的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。“回归”源于最佳拟合,表示要找到的最佳拟合参数。 优点:计算代价不高,易于理解和实现 缺点:易欠拟合,分类精度可能不高 适用数据类型:数值型和标称型 sigmoid函数 梯度算子总是指向函数值变化最快的方向 梯度上升算法伪代码: 二、代码实现 2.1 加载数据