Kili Python SDK 使用教程
1. 项目介绍
Kili Python SDK 是 Kili 平台的 Python 客户端,它允许用户查询和操作 Kili 平台中的主要实体,如项目、资源、标签和 API 密钥等。Kili 平台致力于通过高质量训练数据的创建,推动机器学习的数据中心化方法。它提供了协作数据标注工具和 API,使用户能够快速迭代可靠的数据集构建和模型训练过程。
2. 项目快速启动
首先,确保你的 Python 环境版本不低于 3.8。接着,创建并复制一个 Kili API 密钥,并将其添加到你的环境变量中。
export KILI_API_KEY='<你的 API 密钥>'
安装 Kili 客户端:
pip install kili
初始化 Kili 客户端:
from kili.client import Kili
kili = Kili(api_key='<你的 API 密钥>')
现在你可以使用 Kili 客户端了!
3. 应用案例和最佳实践
以下是使用 Kili Python SDK 的一些典型应用案例:
创建标注项目
json_interface = {
"jobs": {
"CLASSIFICATION_JOB": {
"mlTask": "CLASSIFICATION",
"content": {
"categories": {
"RED": {"name": "Red"},
"BLACK": {"name": "Black"},
"WHITE": {"name": "White"},
"GREY": {"name": "Grey"}
},
"input": "radio"
},
"instruction": "Color"
}
}
}
project_id = kili.create_project(
title="Color classification",
description="Project description",
input_type="IMAGE",
json_interface=json_interface
)['id']
导入数据以进行标注
assets = [
{"externalId": "example 1", "content": "https://example.com/image1.jpg"},
{"externalId": "example 2", "content": "https://example.com/image2.jpg"},
# 添加更多资源...
]
external_id_array = [a.get("externalId") for a in assets]
content_array = [a.get("content") for a in assets]
kili.append_many_to_dataset(
project_id=project_id,
content_array=content_array,
external_id_array=external_id_array,
)
导入预测结果
prediction_examples = [
{"external_id": "example 1", "json_response": {"CLASSIFICATION_JOB": {"categories": [{"name": "GREY", "confidence": 46}]}}},
{"external_id": "example 2", "json_response": {"CLASSIFICATION_JOB": {"categories": [{"name": "WHITE", "confidence": 89}]}}},
# 添加更多预测...
]
kili.create_predictions(
project_id=project_id,
external_id_array=[p["external_id"] for p in prediction_examples],
json_response_array=[p["json_response"] for p in prediction_examples],
model_name="My SOTA model"
)
导出标签
kili.export_labels("your_project_id", "export.zip", "yolo_v4")
4. 典型生态项目
Kili Python SDK 可以应用于多种生态项目,例如图像分类、对象检测、视频分类等。通过社区的力量,已经有许多成功的案例可以供开发者学习和参考,从而在自己的项目中实现高效的数据标注和模型训练。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考