Python数据分析——基于逻辑回归的肿瘤预测实验
前两天参加人工智能比赛,生了一场病,嗓子哑的说不出话。虽然这也不是偷懒的理由,但意志确实是有所消沉。最近手里也没有要忙的事情了,沉下心来敲敲代码,搞搞科研(改论文)~
一、 实验准备
1.1 实验概述
逻辑回归(Logistic Regression)
logistic回归是用于处理因变量为分类变量的回归问题,常见的是二分类或二项分布问题,也可以处理多分类问题,它实际上是属于一种分类方法,是二分类问题的概率与自变量之间的关系图形往往是一个S型曲线,采用的Sigmoid函数实现。
也是一种广义线性回归(generalized linear model),因此与多重线性回归分析有很多相同之处。它们的模型形式基本上相同,都具有 w‘x+b,其中w和b是待求参数,其区别在于他们的因变量不同,多重线性回归直接将w‘x+b作为因变量,即y =w‘x+b,而logistic回归则通过函数L将w‘x+b对应一个隐状态p,p =L(w‘x+b),然后根据p 与1-p的大小决定因变量的值。logistic回归的因变量可以是二分类的,使用sigmoid进行处理,如下图所示:
Sigmoid函数由下列公式定义,f(x)= 1 1 + e − x \frac{1}{1+e^{-x}} 1+e−x