- 博客(7)
- 收藏
- 关注
原创 神经网络(NN)基础知识
np.random.RandomState.rand(),返回一个[0,1)的随机数np.vstack(数组1,数组2),将两个数组按垂直方向叠加tf.where(条件语句,真返回A,假返回B)tf.greater(a,b),判断a是否大于b使用下面三种函数生成网格:np.mgrid[起始值:结束值:步长,起始值:结束值:步长,...]x.ravel(),将x变为一维数组,把把变量拉直np.c_[],返回的间隔数值点配对——np.c_[数值1,数值2,...]
2024-07-10 11:14:40
912
原创 TF常用函数
tf.Variable()将变量标记为‘可训练’,被标记的变量会在反向传播中记录梯度信息。enumerate是python的内建函数,它可遍历每个元素(列表,元组,字符串),组合:索引 元素,常用于for 循环中。tf.one_hot,独热编码:在分类问题中,常用独热编码做标签 1表示是,0表示非。在一个二维张量或数组中,可以通过调整axis 等于0或1 控制执行维度。axis=0代表跨行(经度,down),计算张量沿着指定维度的平均值,和。计算张量维度上的最小,最大值。赋值操作,更新参数的值并返回。
2024-07-09 10:37:54
272
原创 数据预处理——管道
我们使用该类将不同的预处理步骤捆绑在一起#导入模块#对缺失值进行处理#对分类变量进行处理#strategy可以指定空值填充策略——对数值型变量进行处理#使用独热编码对分类型数据进行处理])#进行捆绑])
2024-06-23 17:33:10
710
原创 分类变量的处理
分类变量仅采用有限数量的值,询问您多久吃一次早餐,并提供四个选项:“从不”、“很少”、“大多数天”或“每天”。在这种情况下,数据是分类的,因为响应属于一组固定的类别。如果您尝试将这些变量插入 Python 中的大多数机器学习模型中,而没有先对其进行预处理,则会收到错误。在本教程中,我们将比较可用于准备分类数据的三种方法。删除分类变量用该方法删除object列。
2024-06-23 16:41:09
309
原创 Linux操作系统——Hadoop集群搭建
Hadoop是一个开源的分布式计算框架,用于处理大规模数据集的存储和处理。它基于Google的MapReduce和Google文件系统(GFS)的思想,并使用Java语言编写。Hadoop的主要特点是高可靠性、可扩展性和高效性。
2024-05-22 22:08:04
1350
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人