7、Amazon SageMaker：机器学习全流程解决方案

最新推荐文章于 2025-12-09 18:06:53 发布

wine

最新推荐文章于 2025-12-09 18:06:53 发布

阅读量20

点赞数

CC 4.0 BY-SA版权

分类专栏： AWS机器学习实战指南文章标签： Amazon SageMaker 机器学习数据处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wine/article/details/152388513

AWS机器学习实战指南专栏收录该内容

31 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

Amazon SageMaker：机器学习全流程解决方案

1. 数据处理

在机器学习工作流程中，数据处理是关键的前置步骤。在使用 Amazon SageMaker 时，可以利用 SageMaker Python SDK 中的 PySparkProcessor 类进行数据处理。通常会使用多个实例来处理数据，此时可以通过 S3 键对输入对象进行分片，确保每个实例处理相同数量的输入文件。

2. SageMaker GroundTruth

SageMaker GroundTruth 在机器学习生命周期的预处理阶段提供了重要功能。使用监督训练算法训练机器学习模型时，需要高质量的标注数据。GroundTruth 为常见任务类型（如图像分类或文档分类）提供了内置的标注功能，同时也支持完全自定义的工作流程。

劳动力选择 ：可以使用公共劳动力（Amazon Mechanical Turk）、私有劳动力或供应商公司进行数据标注。
自动化数据标注 ：对于某些任务类型，可以选择使用自动化数据标注，它利用主动学习并行训练模型，并决定将哪些数据样本发送给人工标注员。
用户界面 ：涉及图像、视频帧、文本数据和 LiDAR 数据的内置任务类型具有安全的托管用户界面，也可以为数据标注作业提供自定义用户界面。

更多关于 SageMaker GroundTruth 的信息，请访问：https://docs.aws.amazon.com/sagemaker/latest/dg/data-l

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。