Tensorflow学习笔记:线性回归Titanic生存预测

本文介绍了使用Tensorflow进行线性回归,通过Titanic数据集预测乘客生存率。首先解释了线性回归的基本概念,然后详细阐述了数据预处理、特征列的创建、模型训练和输入函数的定义,最终模型达到了约75%的预测准确率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

线性回归 Linear Regression

线性回归是机器学习的最基本形式之一,用于预测数值。 它通常用于查找两个或多个事物之间的相关性。 在本教程中,我们将使用线性模型从 Titanic 数据集中预测乘客的存活率。

什么是线性回归 ?

这是线性回归算法的表面解释。 线性回归遵循一个非常简单的概念。 如果数据点是线性相关的,我们可以为这些点生成一条最佳拟合线,并用它来预测未来值。这是一个具有一个特征和一个标签的数据集的示例
在这里插入图片描述
最佳拟合线由蓝线给出,并由方程式表示(y=mx+by=mx+by=mx+b)。 在具有更多特征的较大数据集中,找到这种线性回归将变得更加复杂。 但是一旦我们生成了这条线,我们就可以使用该方程来预测输出。 我们只需要将数据点的特征传递到直线方程中,并使用输出作为我们的预测。

我们刚介绍了linear regression,但是我们在做分类题的时候我们用的是逻辑回归(logistic regression),具体区别为 在这里插入图片描述
了解这两个数学概念之间的区别很重,但是也不难,建议大家自己研究他们的区别,然后了解为什么在机器学习中我们用的是逻辑归回,

Titanic生存预测

数据 Data

先倒入相关模块

# Imports
from __future__ import absolute_import, division, print_function, unicode_literals
import tensorflow as tf
import numpy as np
import pandas as pd

数据可能是机器学习中最重要的部分。因此,我们首先必须专注于分析,预处理和选择合适的数据。首先,我们需要加载和分析数据

# load dataset
dftrain = pd.read_csv('https://storage.googleapis.com/tf-datasets/tita
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值