CMP7(类Cloudera CMP 7 404版华为Kunpeng)用开源软件Label Studio做数据标注
摘要:Cloudera CMP作为企业级大数据平台,虽不直接提供数据标注功能,但可集成开源工具构建AI处理流程。推荐四款私有化部署工具:通用多模态标注首选LabelStudio;专注NLP的Doccano;国产多模态工具LabelU;专业CV标注工具CVAT。通过CML(Cloudera Machine Learning)可部署这些工具,数据存储于CDP数据湖(HDFS/S3),实现标注-训练闭环。具体部署方式包括CML Session快速测试和Job持久化运行,并建议生产环境使用PostgreSQL和外部


