探索认知服务 API:功能与实践
1. 认知服务 API 概述
认知服务提供了 21 种不同的 API,这些 API 依据功能可分为五个顶级领域,分别是视觉、语音、语言、知识和搜索。下面将详细介绍各领域的 API 及其功能。
1.1 视觉领域 API
视觉领域的 API 可让应用理解图像和视频内容,能获取面部、情感等视觉信息,还能稳定视频、识别名人、读取图像文字以及生成缩略图等。该领域包含以下几个 API:
| API 名称 | 功能描述 |
| — | — |
| 计算机视觉(Computer Vision) | 从图像中提取可操作信息,如识别图像格式、大小、颜色、面部等,检测图像是否成人向,识别并提取图像文字,检测名人,生成高效存储的缩略图。 |
| 情感识别(Emotion) | 识别图像和视频中的情感,检测的情感包括愤怒、轻蔑、厌恶、恐惧、快乐、中性、悲伤和惊讶等跨文化情感,可为应用提供更个性化体验。 |
| 面部识别(Face) | 用于检测、识别、组织和标记照片中的面部,除了基本的面部检测,还能判断两张脸是否属于同一人,识别面部并查找相似面部。 |
| 视频处理(Video) | 对应用中的视频进行分析、编辑和处理,可稳定抖动视频,检测和跟踪视频中的面部,检测静止背景视频中的运动,生成视频缩略图摘要。 |
| 视频索引器(Video Indexer) | 上传视频后可立即开始索引,利用强大的人工智能改善内容发现,无需专家或自定义代码即可获取视频洞察。 |
| 内容审核(Content Moderator) | 利用机器学习自动审核内容,可检测超过 100 种语言的潜在冒犯性和不需要的图
超级会员免费看
订阅专栏 解锁全文
7106

被折叠的 条评论
为什么被折叠?



