数学在任何机器学习算法中都至关重要,并包括各种数学核心概念,以便以特定方式设计正确的算法。
以下是数学对于机器学习和数据科学的重要性:

现在,让我们专注于从自然语言处理的角度来看,机器学习的主要数学概念 -
向量
向量被认为是一组数字,可以是连续或离散的,包含向量的空间被称为向量空间。向量的空间维度可以是有限的或无限的,但已经观察到机器学习和数据科学问题通常涉及具有固定长度的向量。
向量的表示如下所示 -
temp = torch.FloatTensor([23,24,24.5,26,27.2,23.0])
temp.size()
输出 - torch.Size([6])
在机器学习中,我们处理多维数据。因此,向量变得非常重要,被视为任何预测问题陈述的输入特征。
标量
标量被称为具有零维,只包含一个值。就PyTorch而言,它不包括具有零维的特殊张量;因此,声明如下 -
x = torch.rand(10)
x.size()
输出 - torch.Size([10])
矩阵
大多数结构化数据通常以表格或特定矩阵的形式表示。我们将使用一个名为"波士顿房价"的数据集,该数据集可以在Python的scikit-learn机器学习库中轻松获取。
boston_tensor = torch.from_numpy(boston.da
本文强调了数学在机器学习和数据科学中的关键作用,特别是从自然语言处理的角度。介绍了向量、标量和矩阵的概念,并用PyTorch展示了如何处理这些数学对象。以波士顿房价数据集为例,演示了矩阵在表示结构化数据中的应用。
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



