线性回归 Linear Regression
线性回归是机器学习的最基本形式之一,用于预测数值。 它通常用于查找两个或多个事物之间的相关性。 在本教程中,我们将使用线性模型从 Titanic 数据集中预测乘客的存活率。
什么是线性回归 ?
这是线性回归算法的表面解释。 线性回归遵循一个非常简单的概念。 如果数据点是线性相关的,我们可以为这些点生成一条最佳拟合线,并用它来预测未来值。这是一个具有一个特征和一个标签的数据集的示例
最佳拟合线由蓝线给出,并由方程式表示(y=mx+by=mx+by=mx+b)。 在具有更多特征的较大数据集中,找到这种线性回归将变得更加复杂。 但是一旦我们生成了这条线,我们就可以使用该方程来预测输出。 我们只需要将数据点的特征传递到直线方程中,并使用输出作为我们的预测。
我们刚介绍了linear regression,但是我们在做分类题的时候我们用的是逻辑回归(logistic regression),具体区别为
了解这两个数学概念之间的区别很重,但是也不难,建议大家自己研究他们的区别,然后了解为什么在机器学习中我们用的是逻辑归回,
Titanic生存预测
数据 Data
先倒入相关模块
# Imports
from __future__ import absolute_import, division, print_function, unicode_literals
import tensorflow as tf
import numpy as np
import pandas as pd
数据可能是机器学习中最重要的部分。因此,我们首先必须专注于分析,预处理和选择合适的数据。首先,我们需要加载和分析数据
# load dataset
dftrain = pd.read_csv('https://storage.googleapis.com/tf-datasets/tita