训练数据:人工智能系统的基石与实践指南
1. 写作初衷与训练数据的重要性
起初,我只是撰写简短的文章,聚焦于狭窄的主题,以此填补知识空白。但我逐渐意识到,需要更全面地阐述相关内容,于是决定撰写一部书籍。尽管在该领域工作了约三年,开始写作时我仍充满疑虑,觉得自己计划撰写的部分内容是一个“理想”目标。然而,回顾过往,我发现很少有人能在业务扩展的同时保持对该领域深入的技术理解。我具备深入的技术理解、对其发展历史的了解、用非专业术语解释这些主题的能力,以及将知识记录并分享给他人的愿望。
我坚信训练数据是长期以来技术领域中最重要的概念性转变之一。有监督的训练数据贯穿各个行业和几乎所有产品,在未来几十年里,它将以我们如今难以想象的方式塑造我们的生活。
2. 训练数据的用途
训练数据是人工智能/机器学习系统的基础,它能让这些系统正常运行。借助训练数据,我们可以构建和维护现代机器学习系统,例如创建下一代自动化系统、改进现有产品,甚至开发全新的产品。
为了使原始数据发挥最大作用,需要对其进行升级和结构化处理,使其能够被机器学习程序使用。通过创建和维护所需的新数据和结构,如注释和模式,我们可以让原始数据变得有用,从而踏上实现优秀整体解决方案的道路。
常见的应用场景主要围绕以下几个关键需求:
- 改进现有产品(如性能),即使目前产品中并未应用机器学习技术。
- 生产新产品,包括以有限或“一次性”方式运行的系统。
- 进行研究和开发。
训练数据贯穿机器学习程序的各个环节:
- 训练模型需要训练数据。
- 想要提高性能,需要更高质量、不同类型或更大数量的训练数据。
超级会员免费看
订阅专栏 解锁全文
7万+

被折叠的 条评论
为什么被折叠?



