机器学习入门:从基础概念到实战应用
1. 机器学习简介
机器学习让计算机能够解决几年前还难以处理的问题,极大地拓展了可能性的边界。从欺诈检测、医疗诊断到产品推荐,再到能“看到”前方路况的汽车,机器学习每天都在影响着我们的生活。科学家们也在利用机器学习解锁人类基因组的秘密,未来攻克癌症或许也离不开它的助力。
传统的算法式问题解决方式,是根据既定的算法编写代码,输入数据后得到输出。但对于一些复杂问题,如判断照片中是猫还是狗,用传统算法很难实现,因为总会遇到让算法失效的特殊图片。
机器学习则采用不同的方法,它通过分析输入和输出的数据集,在训练过程中学习如何生成自己的输出。学习算法会将数学模型与数据进行拟合,编码输入数据和输出数据之间的关系。训练好的模型可以接受新的输入,并生成与训练数据一致的输出。例如,要区分猫和狗的照片,不需要编写专门的算法,而是用猫和狗的照片来训练机器学习模型,其成功与否取决于所使用的学习算法以及训练数据的质量和数量。
2. 什么是机器学习
从本质上讲,机器学习是一种在数字中寻找模式并利用这些模式进行预测的方法。它可以用由 1 和 0 组成的行或序列来训练模型,从数据中学习,以便在给定新序列时预测结果。
以一个简单的由 1 和 0 组成的数据集为例,第四列的每个数字都与同一行中前三个数字有关。数据科学家将包含答案的列称为标签列,其余列称为特征列。预测模型的目标是在特征列的行中找到模式,从而预测标签。
然而,现实世界中的数据集通常更大、更复杂。机器学习的核心就是在大规模的数字数据集中寻找模式,数据量越大,往往越有利于发现模式。
机器学习可以通过对数字集合中的模式进行
超级会员免费看
订阅专栏 解锁全文
7235

被折叠的 条评论
为什么被折叠?



