计算机视觉与自然语言处理:从目标检测到文本处理的技术之旅
1. 目标检测基础与COCO数据集模型
当置信阈值降至0.55时,模型不仅能检测到狗,还能检测到沙发。基于COCO数据集训练的模型,具备检测多种物体的能力,涵盖交通信号灯、停车标志、各类食物和动物,甚至瓶子和酒杯等。你可以用自己的图像进行测试,亲身体验先进的目标检测技术。
COCO数据集训练的目标检测模型能轻松检测和识别80种不同类型的物体。然而,若你需要检测其他特定物体,如汽车牌照、门前包裹或组织样本中的癌细胞,就不能仅依赖基于COCO图像训练的模型。从头训练目标检测模型是一项艰巨的任务,即便对于微软、脸书和谷歌的研究人员来说也是如此。虽然可以从COCO权重开始,逐步用新类别训练网络,但这仍需要大量的计算资源和时间。
2. Azure Custom Vision服务实现自定义目标检测
有一种更简单的方法,即使用Azure Cognitive Services中的Custom Vision服务。该服务是Azure Cognitive Services家族的一员,能让你在无需深厚机器学习和人工智能专业知识的情况下,为应用程序添加智能。Custom Vision服务可用于构建图像分类模型和目标检测模型,并在云端的GPU上进行训练。训练完成后,你可以将模型部署为Web服务,通过REST API调用,也可以将其下载为多种格式(如TensorFlow和Core ML),在本地使用。
使用Custom Vision服务的具体步骤如下:
1. 准备工作 :需要一个Microsoft账户和Azure订阅。若没有Microsoft账户,可免费创建;若
超级会员免费看
订阅专栏 解锁全文
1293

被折叠的 条评论
为什么被折叠?



