AWS 服务全解析:从工业监控到智能客服的多元应用
1. 工业监控与维护相关服务
1.1 Panorama 服务
Panorama 可用于监控工作场所的闭路电视(CCTV),检测潜在的健康和安全合规问题,例如工人防护装备不全或在机器周围有危险行为。在零售环境中,它还能用于监控和跟踪客流量,这有助于优化员工排班和提高销售额。
Panorama 配套的硬件设备是 Panorama Appliance,它负责处理连接到它的现场摄像头的视频流。还可以连接显示器,实时本地查看视频流和事件。与 Lookout for Vision 不同的是,使用 Panorama 时,Appliance 会处理所有捕获和传输照片或视频帧的工作,而 Lookout for Vision 需要开发者自行开发相关流程。此外,支持的智能相机通过提供的软件可直接连接到 Panorama 服务,无需 Appliance。模型可以在云端训练,然后部署到 Appliance 上运行,这样能降低延迟并避免网络连接问题。
1.2 预测性维护服务
通过传感器数据实时分析机器状况,获取预测性维护见解。具体操作步骤如下:
1. 监控振动、声音和温度等指标,跟踪机器状态并建立正常状态模型。
2. 将新数据与正常状态模型进行比较,若出现异常,则表明可能即将发生故障,需要进行预防性维护。
3. 异常情况可自动通知相关利益相关者,实时检测问题能简化维护工作,避免影响生产力的计划外停机。
Lookout for Equipment 在检测到异常时,能定位提供数据的传感器,引导支持人员前往维护区域并找出潜在根本原因。该服务有一个训练阶段,需要输入历史传感器数据和维护信息,通过分析这些数据训练模型,并通过持续学习提高模型准确性。训练好的模型会分析新的传感器读数,并将见解存储在 S3 存储桶中,之后可根据需求自动触发自定义工作流程和通知。
Monitron 服务中,传感器设备附着到资产上后,会开始收集数据,通过网关设备安全地将数据发送到云端进行模型训练。模型训练完成后,会分析传入数据,查找异常并生成见解。该服务还配备移动应用程序,可与资产上的设备关联,接收云端服务的见解和警报,并提供监控资产的数据和健康状况的仪表板视图。
1.3 资产管理服务 - SiteWise
SiteWise 是一个综合性服务,具有以下特点:
-
资产建模
:用于构建物理资产的数字双胞胎,在模型中包含资产的属性和关系,以定义整个设施,从而更好地理解收集的数据及其在工作流程中的位置和与设施各部分的关系。
-
资产指标
:包含数据流以及可定义的固定或计算设备属性,将这些信息集中存储,便于分析。
-
SiteWise Edge
:在本地运行,便于在将数据发送到云端之前进行本地收集、组织和处理,有助于简化数据传输量并满足合规要求。它支持多种数据摄入方法,包括常见的消息传递和物联网协议。
-
SiteWise Monitor
:可创建无代码、完全托管的 Web 应用程序,用于可视化和交互操作收集的运营数据,还能定义警报以响应设备行为和潜在性能问题。
-
API 支持
:应用程序可使用服务的 API 轻松从 SiteWise 检索资产数据和计算指标,也可订阅近乎实时的数据流,为自定义仪表板提供数据。
SiteWise 是无服务器服务,根据使用情况计费,不同功能费用不同,具体费用需查看文档。
以下是这些服务的关系流程图:
graph LR
A[传感器设备] --> B[数据收集]
B --> C[数据传输到云端]
C --> D[模型训练]
D --> E[异常检测]
E --> F[通知利益相关者]
G[现场摄像头] --> H[Panorama Appliance]
H --> I[视频流处理]
J[资产] --> K[数字双胞胎建模]
K --> L[数据集中分析]
2. AWS 托管机器学习服务
2.1 Rekognition 服务
Rekognition 适用于处理大量用户生成内容的平台,如社交媒体、游戏和配对平台。它可用于主动审核大量媒体数据,保护用户免受不适当或非法内容的侵害,也可用于媒体和电子商务解决方案的合规性检查,识别潜在不安全内容并分配适当的年龄和内容评级。此外,还能帮助品牌过滤与敏感内容的关联。
2.2 DeepLens 服务
DeepLens 是一款商用高清摄像头,内置计算能力,使开发者更易使用计算机视觉功能。可将 SageMaker 模型直接部署到 DeepLens 上,模型部署后,视频分析在设备上进行,无需连接网络或额外硬件。它包含多个教程和示例项目,社区项目也易于部署和实验。其服务可用于目标检测、目标分类、人脸识别、情感分析和活动识别等,支持与 SageMaker 和 Lambda 集成,以实现更多自定义功能。
2.3 Textract 服务
Textract 用于处理页面内容,支持 PNG、JPEG 和 PDF 文件格式,按处理的图像或 PDF 页面收费。与 Rekognition 不同,Rekognition 不支持处理页面内容。
2.4 Polly 服务
Polly 是 AWS 的文本转语音服务,它将书面文本转换为语音。有标准语音(听起来有点机械)和使用机器学习技术训练的现代神经语音(听起来非常接近人类)。该服务支持多种语言、口音和性别,还能创建自定义语音,但目前这是一项定制且昂贵的服务,需直接与 Polly 产品团队合作,大部分模型训练由他们完成。随着合成语音训练技术的进步,未来有望成为更经济实惠、可自行管理的过程。Polly 按处理的字符数计费,相同文本的重播在一段时间内缓存免费,比聘请配音人才便宜,且能按需即时获取结果,适用于以下场景:
- 在线内容的低成本多语言配音
- 视频和公告系统
- 虚拟化身的动态按需语音,如 Sumerian 服务中的虚拟化身
- 应用程序中的音频响应,使应用更具包容性
2.5 Transcribe 服务
Transcribe 是语音转文本服务,可将音频文件、视频文件或实时流中的语音记录转换为文本。输出除了纯文本外,还包括每个单词或字符的准确时间、置信度和替代解释。它支持多种音频和视频格式,如 FLAC、MP3、MP4、OGG、WebM、AMR 和 WAV。还可配置特定领域或行业的词汇,帮助识别不熟悉的单词、首字母缩写词或缩写。
常见用例如下:
-
创建视频字幕
:输出包含准确时间和说话人识别信息,结合第三方库可将输出转换为常见字幕格式(如 SRT)。还可与 Translate 服务集成,自动生成多种语言的字幕。例如,Transcribe 输出如下:
"items": [
{
"start_time": "1.15",
"end_time": "1.35",
"alternatives": [
{
"confidence": "1.0",
"content": "How"
}
],
"type": "pronunciation"
},
{
"start_time": "1.35",
"end_time": "2.05",
"alternatives": [
{
"confidence": "1.0",
"content": "about"
}
],
"type": "pronunciation"
}
...
]
转换为 SRT 字幕格式后:
1
00:00:01,150 --> 00:00:03,899
How about language?
2
00:00:03,899 --> 00:00:05,112
Several languages can be transcribed.
- 提取通话分析和见解 :Transcribe call analytics 功能可转录通话记录,并使用自然语言处理揭示通话见解,包括情感分析、检测到的问题和语音特征(如通话时间、速度和中断情况)。这些见解可用于生成报告、改进服务和实现呼叫中心自动化,如自动匹配问题和可能的解决方案。
- 检测和编辑通话转录中的个人信息 :可在文本转录和音频文件中编辑个人信息,返回个人数据被屏蔽的编辑后音频文件。
Transcribe 按转录的音频秒数计费,最低收费 15 秒,目前支持 38 种语言和变体。
以下是部分机器学习服务的特点对比表格:
| 服务名称 | 功能 | 适用场景 | 收费方式 |
| ---- | ---- | ---- | ---- |
| Rekognition | 审核媒体数据、识别不安全内容、过滤品牌关联 | 社交媒体、游戏、电子商务等 | 未提及 |
| DeepLens | 计算机视觉功能,如目标检测等 | 开发者项目 | 未提及 |
| Textract | 处理页面内容 | 文档处理 | 按处理的图像或 PDF 页面收费 |
| Polly | 文本转语音 | 在线内容配音、应用音频响应等 | 按处理的字符数计费 |
| Transcribe | 语音转文本 | 视频字幕、通话分析等 | 按转录的音频秒数计费 |
3. AWS 聊天机器人与自然语言处理服务
3.1 Lex 服务
Lex 最适合订单工作流程,在这类流程中,需要用户提供已知输入,然后将其转换为特定订单。例如,在预订航班时,聊天机器人可以获取用户输入的出发机场、目的地机场、日期、时间和舱位等信息。用户需要配置所需的用户输入,并限制每个输入的类型或值集,Lex 会负责获取这些信息。
虽然使用 Lex 构建和部署聊天机器人比从头开发更容易,但要构建一个成功的 Lex 聊天机器人仍需要一定的专业知识。特别是,深入了解目标用户、他们可能的交互方式以及使用的语言,对于提供良好用户体验的有效聊天机器人至关重要。Lex 支持各种内容类型、输入值和其他功能,以引导对话。在幕后,对话的每个步骤都可以提供给自定义微服务,以实现更复杂的交互和与第三方系统的集成。
Lex 的使用场景包括 Web、移动和呼叫中心集成的订单和预订工作流程,以及一些支持和提高生产力的场景。Lex 按每次文本和语音请求计费。
3.2 QnA Bot 服务
QnA Bot 是基于 Amazon Lex 构建的开源、多渠道、多语言对话式聊天机器人。开发者可以策划一份问题和答案列表,机器人将使用这些列表回答客户的问题。它集成了机器学习工具(如 Translate)以提供多语言功能。例如,当客户用法语提问时,机器人会自动将问题翻译成英语,与数据库中的问题进行匹配,将答案翻译成法语,然后返回翻译后的答案。
除了策划的问题列表,QnA Bot 还可以集成 S3、SharePoint、Salesforce 和内容管理系统(CMS)等资源,作为回答客户查询的来源,使其能够回答可能未包含在策划列表中的问题。此外,QnA Bot 还可以提问,以收集客户反馈,改善用户体验。
3.3 Comprehend 服务
Comprehend 是一种自然语言处理(NLP)服务,可分析文本内容以提供见解。许多功能与 Transcribe 通话分析中的功能类似,因为 Comprehend 是这些分析的底层驱动。这些见解包括语言识别、关键短语提取、语法分析和情感分析。
该服务可以从网页和产品目录条目等文本中生成关键字和描述,理解社交媒体、评论、反馈表单和其他来源的文本的情感、含义和意图。它可以检测和编辑个人身份信息(PII),帮助满足隐私法规合规性要求。还可以创建自定义 NLP 模型,对文本进行分类并提取自定义实体,以满足新的用例或特定行业的需求。
Comprehend 目前支持 12 种语言,但可以在将文本传递给 Comprehend 之前通过 Translate 服务运行,间接支持更多语言。该服务的相关用途包括为内容、存档和其他数据集生成描述性元数据,以及分析社交媒体、支持工单和其他帖子或用户消息的情感、意图或类别。Comprehend 按每 100 个字符的每个分析类别计费,每次请求最低消费 300 个字符。
以下是这三种服务的对比表格:
| 服务名称 | 核心功能 | 适用场景 | 收费方式 |
| ---- | ---- | ---- | ---- |
| Lex | 处理订单工作流程,引导用户输入并转换为订单 | 订单和预订、客户支持 | 按每次文本和语音请求计费 |
| QnA Bot | 多语言问答,集成多种资源回答问题 | 客户服务、信息查询 | 未提及 |
| Comprehend | 自然语言分析,提供多种见解 | 文本分析、数据分类 | 按每 100 个字符的每个分析类别计费,每次请求最低消费 300 个字符 |
4. AWS 账本技术服务
随着技术和云计算的成熟,云服务提供商开发了新的服务来满足更特定的用例。账本技术在过去几年中得到了越来越多的支持,主要用于验证数据完整性。
在传统数据库中,数据可以存储、编辑和删除。当编辑数据项时,它会替换前一个值。虽然备份中可能仍保留前一个值,但这些来源不适合验证数据完整性,需要手动比较和检测意外或恶意更改,并恢复备份。
而使用账本技术时,现有记录不会被更改。相反,会添加一个代表更新的新记录,旧记录仍然可用,允许审计所有更改的历史记录,就像会计的账本一样。每个新记录都会生成一个单向加密哈希,用一组唯一的字符表示数据,就像证明数据未被更改的 ID 或证书。更新记录使用前一个记录的哈希和新数据进行哈希处理,将它们以块的形式链接在一起,这就是区块链名称的由来。这防止了直接更改以前的记录,任何未经授权的直接修改现有值的尝试都会破坏链,记录将被标记为受损。这种更改会被完全阻止,或者可以自动恢复有效数据。
AWS 提供了与账本技术相关的两种服务:Managed Blockchain 和 Quantum Ledger Database(QLDB)。
-
Managed Blockchain
:该服务采用去中心化方法,每个节点都记录所有更改。完全托管的节点相互通信,以验证数据的准确性和完整性。AWS Managed Blockchain 支持两种流行的开源区块链:Ethereum 和 Hyperledger Fabric,适用于在这两种区块链网络上运行的任何用例。
-
Quantum Ledger Database(QLDB)
:QLDB 更像是一个数据库服务,而不是托管区块链网络。与网络不同,QLDB 是集中式的,由 AWS 拥有和运营。QLDB 确保存储的数据是不可变的,并且可以进行加密验证。它具有高可用性,支持多副本和持续备份,并且是无服务器服务,根据存储和查询的实际使用情况计费。数据库上的查询类似于 SQL,返回 JSON 响应,这对大多数开发者来说应该很熟悉。QLDB 特别适用于记录系统和类似用例,以及应用程序中的财务或其他交易账本类型的需求。它还可以考虑用于存储敏感日志,其中不可变的特性有助于确保可验证的审计跟踪。
以下是传统数据库与账本技术的对比流程图:
graph LR
A[传统数据库] --> B[数据可编辑、删除]
B --> C[旧值被替换]
C --> D[验证数据完整性困难]
E[账本技术] --> F[现有记录不变]
F --> G[添加新记录代表更新]
G --> H[可审计更改历史]
H --> I[数据完整性易验证]
5. AWS 呼叫中心服务 - Amazon Connect
传统呼叫中心的建设和运营成本高昂,需要考虑多个方面的成本,包括为所需数量的座席提供足够的空间、硬件和软件许可证、电话线等,以及管理、维护和支付这些费用。通常,所有呼叫都由座席接听,即使先通过数字菜单帮助分类呼叫类型和管理队列,呼叫者也很少能在数字菜单中找到所需答案而无需与座席交谈。呼叫过程往往较为手动,座席需要积极倾听并在脚本或数据库中搜索可能的解决方案。呼叫会被记录并手动审查,以评估座席表现或改进服务。
Amazon Connect 是一种无服务器的联络中心解决方案,使组织能够使用完全托管的云服务设置远程呼叫中心。使用云计算意味着座席可以在任何有网络浏览器和互联网访问的地方工作。设置过程简单直接,无需前期投资或长期定期成本。无需安装软件,座席可以在 20 分钟内入职。
组织按客户连接的分钟数付费,这有助于组织让座席灵活工作。没有最低月费、许可费用或长期承诺,这使得组织可以根据需求扩展呼叫中心。
呼叫记录、报告和转录会生成并存储在安全的 S3 存储桶中。管理人员可以通过仪表板视图跟踪呼叫中心的性能,收听过去的记录,生成报告并管理服务级别。AWS Connect 服务包括一系列功能,并与其他云服务集成,有助于改善座席和客户体验。
5.1 Contact Lens
Contact Lens 提供对话的实时转录,当使用某些单词或短语时会发出警报。例如,如果客户说出“取消”这个词,管理人员可以立即收到警报并介入帮助座席解决客户问题。在转录中,所有个人身份信息(PII),如姓名、身份证号码和地址,可以自动编辑,以保护客户并确保符合隐私法规。
5.2 Connect Wisdom
Connect Wisdom 是一个机器学习搜索引擎,它聚合组织内知识库中的信息,使座席能够更快地找到答案或指导。Wisdom 可以连接到多个存储库,如数据库、内部维基、Salesforce、常见问题解答和文档存储。它为座席创建一个集中的仪表板,提供自动推荐和手动搜索功能。Wisdom 会持续学习,座席可以对提供的推荐和答案进行评分,以改进未来的匹配。
5.3 Connect Tasks
Connect Tasks 帮助座席跟踪和优先处理呼叫后需要完成的任务列表。任务使用与 Connect 相同的界面进行管理,座席无需在多个应用程序之间切换。
以下是 Amazon Connect 主要功能的总结列表:
- 无服务器架构,座席可远程工作
- 按客户连接分钟数付费,灵活扩展
- 呼叫记录、报告和转录存储在 S3 桶
- Contact Lens 提供实时转录和 PII 编辑
- Connect Wisdom 聚合信息,帮助座席快速获取答案
- Connect Tasks 管理呼叫后任务
通过以上介绍,我们可以看到 AWS 提供了丰富多样的服务,涵盖工业监控、机器学习、聊天机器人、自然语言处理、账本技术和呼叫中心等多个领域,能够满足不同场景和行业的需求。
超级会员免费看
39

被折叠的 条评论
为什么被折叠?



