LogisticRegression是一种广义线性分类模型,其可通过模拟数据的伯努利分布(对于二分类问题)和多项式分布(对于多分类问题)参数,对样本所属各分类的概率值进行预测。
1. 模型的主要参数
在sklearn中, LogisticRegression模型的主要参数包括:
模型参数 | Parameter含义 | 备注 |
penalty | 正则项 | 广义线性模型的正则项,可选值包括L1正则项'l1'、L2正则项'l2'、复合正则'elasticnet'和无正则项None,默认值为'l2'。值得注意的是,正则项的选择应与优化求解器相匹配(详见`solver`参数)。 |
l1_ratio | 正则权重系数 | L1正则和L2正则的权重系数,取值空间为0-1。若为0,则相当于为L2正则;若为1,则为L1正则,否则为Elasticnet正则。 |
dual | 对偶问题 | 默认值False,可设为True将问题转换为对偶问题(详见本博客SVM问题中原问题-对偶问题的推导),仅适用于采用L2正则化且求解器为'liblinear’的情况。当样本数少于特征数时,推荐为True。 |
tol | 迭代阈值 | 求解器迭代求解时,停止迭代的目标函数改变阈值。 |
C | 正则化系数倒数 | 注意,其值与正则化强度相反,即C值越小&#x |