TensorFlow 使用之 Logistics Regression

本文介绍了如何使用 TensorFlow 实现 Logistic Regression 进行二分类问题的解决,通过人口普查数据预测年收入是否超过5万美元。讨论了模型定义、数据结构,并展示了如何利用TF.learn API训练wide、deep以及wide&deep三种模型。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

这篇文章主要讲使用 TensorFlow 进行 Logistic Regression 训练。

本文要解决的问题是使用逻辑回归解决一个二分类问题,即给定了人口普查的数据如人的年龄,性别,教育程度和职业,来预测一个人的年收入是否超过5万美元,如果超过则输出1,否则输出0。


1. 模型简介

下面先简单看一下本模型的logistic regression定义。

在本文中我们可以将标签设置为Y,如果收入大于50000则设置Y=1,否则设置为0。输入向量为,那么对于给定的输入向量X,Y=1的概率为:


b是我们模型的bias,是一个常量。wi是与xi密切相关的一个量,反映了xi与label的相关性,如果xi与label是正相关的,那么wi就会增加,P(Y=1| X)的概率就会接近1,反之,则会接近0。再来看logistic 函数,它是一个sigmoid函数,

这个函数的作用是将上面的线性模型转换到 [0-1] 的区间,其实也就是一个概率值。最终的目标是求出一组有效的w来使得代价函数最小。


2. 数据基本结构

接着再来看本文所使用的数据,数据的结构如下:

Column Name Type Description
age Continuous The age of the individual
workclass Categorical The type of employer the individual has (government, military, private, etc.).
fnlwgt Continuous The number of people the census takers believe that observation represents (sample weight). This variable will not be used.
education Categorical The highest level of education achieved for that indivi
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值