TensorFlow 使用之 Logistics Regression

置顶

__William__

于 2016-11-09 21:00:46 发布

阅读量1.7w

点赞数 1

CC 4.0 BY-SA版权

分类专栏： Machine Learning 文章标签： Machine Learning 深度学习 TensorFlow 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/willduan1/article/details/53105603

本文介绍了如何使用 TensorFlow 实现 Logistic Regression 进行二分类问题的解决，通过人口普查数据预测年收入是否超过5万美元。讨论了模型定义、数据结构，并展示了如何利用TF.learn API训练wide、deep以及wide&deep三种模型。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这篇文章主要讲使用 TensorFlow 进行 Logistic Regression 训练。

本文要解决的问题是使用逻辑回归解决一个二分类问题，即给定了人口普查的数据如人的年龄，性别，教育程度和职业，来预测一个人的年收入是否超过5万美元，如果超过则输出1，否则输出0。

1. 模型简介

下面先简单看一下本模型的logistic regression定义。

在本文中我们可以将标签设置为Y，如果收入大于50000则设置Y=1，否则设置为0。输入向量为，那么对于给定的输入向量X，Y=1的概率为：

b是我们模型的bias，是一个常量。wi是与xi密切相关的一个量，反映了xi与label的相关性，如果xi与label是正相关的，那么wi就会增加，P（Y=1| X）的概率就会接近1，反之，则会接近0。再来看logistic 函数，它是一个sigmoid函数，

这个函数的作用是将上面的线性模型转换到 [0-1] 的区间，其实也就是一个概率值。最终的目标是求出一组有效的w来使得代价函数最小。

2. 数据基本结构

接着再来看本文所使用的数据，数据的结构如下：

Column Name	Type	Description
age	Continuous	The age of the individual
workclass	Categorical	The type of employer the individual has (government, military, private, etc.).
fnlwgt	Continuous	The number of people the census takers believe that observation represents (sample weight). This variable will not be used.
education	Categorical	The highest level of education achieved for that indivi

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄14年

64
原创

382
点赞

1561
收藏

205
粉丝

关注

私信

热门文章

分类专栏

杭电OJ 3篇
杂谈 11篇
Android 3篇
struts 2篇
struts2 2篇
leetcode 35篇
推荐算法及系统 1篇
Machine Learning 17篇

展开全部收起

上一篇：: TensorFlow 使用之 Logistics Regression

下一篇：: 最大子串和问题（Maximum Subarray）

最新评论

基于深度学习的色情视频鉴定
2401_82990522: cd open_nsfw
基于深度学习的色情视频鉴定
2401_82990522: docker build -t caffe:cpu https://raw.githubusercontent.com/BVLC/caffe/master/docker/cpu/Dockerfile
深度学习优化算法解析(Momentum, RMSProp, Adam)
帅翰GG: 我和您交流一下，我认为在关于RMSprop那一部分说的不是很准确：“虽然初步解决了优化中摆动幅度大的问题。所谓的摆动幅度就是在优化中经过更新之后参数的变化范围，如下图所示，蓝色的为Momentum优化算法所走的路线，绿色的为RMSProp优化算法所走的路线。”这句话。实际上RMSprop算法与动量梯度下降本质上都是为了解决减缓纵坐标方向上的波动幅度，增大或至少不减慢横坐标的速度，从而达到加速梯度下降的目的。二者只是侧重点不同，动量梯度下降侧重的是模拟物理动量概念，增加更新在同一方向上的持续性和稳定性。而RMSProp侧重是调整学习率，让学习率在各个方面自适应。而您说的那个蓝色的线，其实还是吴恩达老师说的 min-batch梯度下降的效果
集成学习总结 & Stacking方法详解
冯诺依曼关门弟子: 感觉应该是 pred = lgb.predict(xxxxxx) 训练完lgb之后，用lgb.predict()就可吧应该。没有试过，感觉应该是这样~
集成学习总结 & Stacking方法详解
ZZ997241791: 哥，解决了吗，我没想明白怎么进行新数据的预测

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。