机器学习基础:从鸢尾花分类入门
一、机器学习的发展与应用
在过去几十年里,机器学习取得了显著进展。1958 年,Frank Rosenblatt 展示了“第一台能够产生原创想法的机器”,尽管当时这台原始机器只是学会识别穿孔卡片上的标记,还被戏称为“由海军设计的会思考的科学怪人怪物”。但经过 60 年的起起落落,人工智能和机器学习在智能表现上逐渐超越人类。
2016 年,DeepMind 设计的 AlphaGo 在围棋比赛中击败了冠军李世石和柯洁,引发了机器学习和人工智能的复兴。近年来,像 GPT - 3 和 Stable Diffusion 这样的模型模糊了科幻与现实的界限,既展现出令人惊叹的智能表现,也存在明显的不足。然而,更令人瞩目的是那些每年推动着数十亿美元经济产出的无数模型,从初创企业到福布斯 500 强企业,从零售到制药等各个行业,都在利用机器学习来加速产品开发和推动行业发展。
二、鸢尾花分类问题引入
(一)问题描述
假设你受雇于一位植物学家,任务是将鸢尾属花卉自动分类到特定的物种类别中,并且要证明系统的最低成功率达到 85%。植物学家已经完成了花卉数据的收集和测量,但没有时间对每一朵花进行单独分类,他们给了你一个包含 150 个样本的数据集,其中鸢尾属的三个物种(塞内卡、变色和维吉尼亚)各有 50 个样本,每个样本包含萼片长度、萼片宽度、花瓣长度、花瓣宽度和物种信息。
(二)项目范围界定
在编写代码之前,明确项目标准至关重要。对于机器学习问题,定义标准与软件项目有所不同。要让机器学习,需要三个主要组件:
1. 任务(Task) :
超级会员免费看
订阅专栏 解锁全文
781

被折叠的 条评论
为什么被折叠?



