tensorflow and sklearn 关于数据集的加载问题

1.仿照的例子就是加利福尼亚的房价预测的问题,作者的源码是直接从sklearn.datasets中调用 fetch_california_housing 函数,可以直接将房价的数据集下载下来,通过运行 tar -zxvf  cal_housing.tgz -C 指定目录下。之后仿照sklearn 的写法,通过np.loadtxt('cal_housing.data', delimiter=',')对数据进行加载,房价数据与数据之间用逗号分隔开 。之后就是选取数据的某些行或者列的问题,其中最值得注意的就是在选取特征和target后, 组成了一个近似字典的数据形式,通过调用sklearn.utils 模块的Bunch。

2. 在作者代码中,在输入数据中加入了一个常量偏置1, 通过一个内嵌的函数np.c_ ,实现的功能就是将两个矩阵按照x轴进行拼接,例如作者提供的例子就是: np.c_[np.array([1,2,3]), np.array([4,5,6])],输出就是array([[1,4],[2,5],[3,6]])

3. 线性回归的正则化的参数theta求解= (X^T  * X)^(-1) * X^T * y 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值