人工智能与机器学习术语详解
在人工智能和机器学习领域,有许多专业术语和缩写,理解这些术语对于深入学习和应用相关技术至关重要。本文将详细解释一系列常见的术语和缩写,帮助读者更好地掌握这一领域的知识。
基础概念术语
术语
定义
Accuracy(准确率)
衡量算法正确性的指标,计算方式为正确预测的数量除以总预测数量,有时也称为总体准确率。
Acoustic model(声学模型)
一种基于音频和文本对进行训练的语音模型,每个音频文件都配有其文本转录,声学模型学习与每个转录相关的精确声音。
AI assistant(人工智能助手)
使用人工智能的自动化助手,接收自然语言输入并为用户执行任务,任务可能包括回答问题、开灯或重置密码等。
All - in - one classifier(一体化分类器)
经过训练以区分多种意图的分类器,它会预测N种不同意图中的一种,每种意图都有相关的置信度值,且置信度值总和为1。
Ambiguous utterance(模糊表述)
本身不代表单一明确意图的文本短语,例如用户说“account”,我们不知道他们是需要开户、销户还是查询账户状态。
Application programming interface (API)(应用程序编程接口)
供其他软件使用的软件接口,与供人类使用的用户界面(UI)或图形用户界面(GUI)相对。
机器学习算法相关术语
术语
定义
Bag of words(词袋模型)
一种分类算法,它计算训练数据中每个不同单词在每个意图中出现的次数,并使用这些计数来学习意图模式。该算法除了计数之外,在处理单词时不应用任何智能,是最简单的实现算法之一。
Binary classifier(二元分类器)
经过训练以识别单一意图的分类器,例如重置密码分类器将短语分为正类(是重置密码)或负类(不是重置密码)。人工智能助手可以使用N个不同的二元分类器来分类N种总意图,当使用多个二元分类器时,它们的置信度值总和不为1。
Classifier(分类器)
分类是将对象组织到一个或多个类别的方法,分类器是执行分类的算法,例如书籍可以分为小说或非小说。
开发与测试相关术语
术语
定义
Blind test(盲测)
对机器学习模型进行的测试,使用模型之前未见过的数据进行测试,确保模型在部署时能很好地处理以前未见过的实例。
Baseline(基线)
对现状或默认状态的测量,在评估自定义机器学习模型时,将其性能与完全未训练的模型进行比较很有用。
Bias(偏差)
与另一组相比,对一组给予不平等的待遇或偏好。机器学习算法从其训练的数据中推断,如果训练数据存在偏差,算法将放大该偏差,因此应非常小心地构建代表用户群体的数据集。
人工智能助手交互相关术语
术语
定义
Command(命令)
人工智能助手应采取的以动词为中心的动作,通常由其他参数澄清,例如“Turn on”是一个命令,由参数“all the lights”澄清。
Command interpreter(命令解释器)
一种人工智能助手模式,用户与助手交互以完成单个任务,然后交互结束。
Command parameter(命令参数)
澄清命令或动作的以名词为中心的短语,在“turn on all the lights”短语中,“all the lights”是命令参数,澄清“turn on”命令。
下面是一个简单的mermaid流程图,展示了人工智能助手处理用户命令的基本流程:
graph TD;
A[用户输入命令] --> B{命令解释器解析};
B -->|解析成功| C[执行命令];
B -->|解析失败| D[反馈错误信息];
C --> E[返回执行结果];
对话与意图相关术语
术语
定义
Compound utterance(复合表述)
包含两个或多个不同用户意图或目标的语句,例如“I want to reset my password and also find out when the store opens”包含“reset password”和“find store hours”意图。
Confidence(置信度)
分类器给出的概率估计,该估计与分类器预测正确的可能性相关,但不相等。
Confirmation prompt(确认提示)
人工智能助手提出的确认其理解的问题,例如用户说“What time are you open”,助手说“To confirm, was that store hours?”,助手使用了确认提示。
Confusion matrix(混淆矩阵)
用于比较分类器实际预测与预期(正确)值的网格,网格的一个轴是正确意图,另一个轴是分类器预测的意图,网格中的每个方块对应正确和预测意图组合出现的次数。
Constrained question(受限问题)
具有有限预期响应的问题,例如“What’s your five - digit zip code?”和“Which store, Elm or Maple?”都是受限问题。
人工智能助手性能与管理相关术语
术语
定义
Containment(处理率)
由人工智能助手完全处理的对话百分比(未升级到人工处理的对话被视为已处理)。
Context variables(上下文变量)
人工智能助手用于维护用户特定或对话特定状态的变量,例如助手可以将用户的名字存储在上下文变量中,以便以后为该用户个性化响应。
Conversational AI; conversational assistant(对话式人工智能;对话式助手)
以完全对话方式与用户交互的人工智能助手,通常也称为聊天机器人或语音机器人。
Coverage(覆盖率)
人工智能助手尝试回答的请求数量与它收到的问题总数的比率。
Customer relationship management (CRM) systems(客户关系管理系统)
存储公司与客户所有交互的软件系统,人工智能助手的对话记录通常存储在CRM系统中。
开发环境与组件相关术语
术语
定义
Development environment(开发环境)
开发人员在与他人共享代码之前编写和测试代码的内部场所,开发环境是对最新代码进行调整和改进直到稳定的地方。
Dialogue engine(对话引擎)
人工智能助手的组件,管理对话状态并协调构建助手对用户的响应。
Dictionary(词典)
具有相同或相似含义的术语的静态列表。
Digression(离题)
用户在对话流程中中途改变话题。
Disambiguation(消除歧义)
当对话式人工智能提出澄清问题时,例如用户说“I need help with account”,助手可以问一个消除歧义的问题:“Do you need to open an account, close an account, or check your account status?”
Drop - off(中断点)
对话流程失败的点,例如用户被要求提供用户ID,但系统未获得有效用户ID,对话流程在这个用户ID问题上中断。
Entities(实体)
用户表述中修改或增强意图的部分,在“Set an alarm for 9 p.m.”中,意图“set an alarm”由实体“9 p.m.”修改,实体通常是名词或名词短语。
Escalation(升级)
当对话式人工智能将用户重定向到另一个渠道以解决问题时,通常是转接到人工处理,也称为hand - off。
人工智能与机器学习术语详解(续)
事件分类与错误处理相关术语
术语
定义
Event classifier(事件分类器)
一种人工智能助手,对传入消息进行分类并将其路由以进行进一步处理,这种人工智能助手没有对话元素,此模式也称为分类和路由。
Fallback condition(后备条件)
常用于对话式人工智能中,处理助手未预期或不理解用户输入的情况,也称为默认条件,助手可能会以“我很抱歉,我不理解”来响应后备条件。
False negative(假阴性)
不应该做出的预测,例如用户要求重置密码,而助手回复商店营业时间,对于重置密码意图存在假阴性。
False positive(假阳性)
不应该做出的预测,例如用户要求重置密码,而助手回复商店营业时间,对于商店营业时间意图存在假阳性。
机器学习特征与评估相关术语
术语
定义
Feature (in machine learning)(特征(机器学习中))
机器学习算法可用于推断如何得到输出的输入特征,机器学习算法通常使用许多不同的特征,词袋文本分类器为其训练数据中的每个单词创建一个特征。
F - score(F分数)
用于评估机器学习模型的准确性指标,考虑两种不同类型的错误,最常见的F分数是F1,它是精确率和召回率的调和平均值。
Functional testing(功能测试)
验证系统行为的软件测试,系统是否按预期执行操作,功能测试可能包括确保重置密码对话流程能重置用户的密码。
Fuzzy matching(模糊匹配)
一种不需要精确匹配的字符串匹配方法,模糊匹配有助于人工智能助手适应拼写错误和打字错误,例如“Mapel”被视为等同于“Maple”。
Grammar(语法)
用于评估输入的严格规则或模式集,当可能的输入数量有限时,语音模型可以使用语法。
Ground truth(真实数据)
经过验证为真实的精选数据集,真实数据可用于训练和/或测试机器学习模型。
下面是一个mermaid流程图,展示了机器学习模型训练和测试的基本流程:
graph TD;
A[准备训练数据] --> B[训练机器学习模型];
B --> C[使用测试数据进行盲测];
C -->|评估成功| D[模型可用];
C -->|评估失败| E[调整模型参数];
E --> B;
意图与测试方法相关术语
术语
定义
Intent(意图)
用户表述中的含义或目标,即用户想要或试图做的事情,例如#reset_password和#set_alarm是示例意图,意图通常以动词为中心,按惯例,意图名称通常以#符号为前缀。
Intent error rate(意图错误率)
评估语音转文本转录准确性的方法,意图错误率是由于语音转录错误而被错误分类的表述数量与表述总数的比率。
Jargon(行话)
只有了解某种语言的一小部分人使用的术语,行话通常是特定领域的。
k - folds cross - validation test(k折交叉验证测试)
对机器学习模型的测试,将训练数据分成k个不同的集合(k是整数,通常为3、5或10),训练k个不同的模型,每个模型省略训练数据的1/k作为测试集,k个不同测试的结果汇总为k折交叉验证测试结果。
Labeled data(标注数据)
具有(输入)特征和(输出)标签的数据集,用于训练机器学习算法,也称为真实数据。
Language model(语言模型)
仅使用文本进行训练的语音模型,文本包括模型可能听到的表述,语言模型学习它应该预期转录的单词和语音序列。
Load testing(负载测试)
验证系统能否同时被许多用户使用而不会导致响应时间或功能下降的软件测试。
Logisitic regression(逻辑回归)
目标输出为离散值的回归算法,分类器通常使用逻辑回归来预测0或1。
模型与自然语言处理相关术语
术语
定义
Machine learning(机器学习)
通过示例学习的软件算法,机器学习算法被给予数据并被要求推断与该数据相关的规则,与传统编程不同,传统编程中程序员将一组规则明确编码到软件程序中,然后针对某些数据运行该程序。
Misclassification(错误分类)
分类错误,如果对于给定的表述,系统应该预测X但却预测了Y,那么对Y的预测就是错误分类。
Model (machine learning model)(模型(机器学习模型))
机器学习算法的输出,模型封装了机器学习算法学习到的模式和规则,模型用于对某些输入数据进行预测。
Natural language understanding (NLU)(自然语言理解)
计算机从自然语言中提取结构和含义的过程。
Net promoter score (NPS)(净推荐值)
基于对“你有多大可能会向朋友或同事推荐我们的公司/产品/服务?”的回答的0 - 10评分系统,最高分(9和10)称为推荐者,最低分称为诋毁者。
Notebook(笔记本)
Python开发中的一种工件,结合了代码和展示,笔记本中的代码可以手动逐步执行或自动批量执行,代码的输出可以存储在笔记本本身中。
Ontology(本体)
在给定领域内组织概念和类别的方法。
Open - ended question(开放式问题)
响应可能有几乎无限变化的问题,例如“How can I help you?”是开放式问题。
Opt out(退出)
当用户要求离开人工智能助手并与人工交互时,常见的退出短语包括“agent”、“representative”、“speak to a human”和“get me out of here”。
其他相关术语
术语
定义
Orchestrator(编排器)
可选的人工智能助手组件,协调对API的调用以驱动业务流程并提供动态响应数据。
Parameters(参数)
通常基于名词的参数,用于修改命令,例如“set an alarm”命令需要“alarm time”参数。
Parts of speech tagging(词性标注)
一种自然语言理解技术,识别输入中每个单词的语法词性(名词、动词、形容词等),词性可以用作机器学习算法中的特征。
Phoneme(音素)
可以组合成单词的不同声音单位,一个口语单词是一个语音序列。
Precision(精确率)
一种准确性测量,惩罚算法的假阳性,例如当算法预测了不应该预测的事件时,公式为:(真阳性)/(真阳性 + 假阳性),一个对任何表述都预测“reset password”意图的助手永远不会错过“reset password”意图,但不会很精确。
Production environment(生产环境)
真实用户与部署的代码进行交互的地方。
Production logs(生产日志)
来自生产系统的应用日志或其他低级数据。
Question - and - answer bot(问答机器人)
没有多步骤流程的对话式人工智能,用户提问,助手回答,然后用户可以再问另一个新问题。
Representative data(代表性数据)
具有与整个总体相同特征分布的样本数据。
Recall(召回率)
一种准确性测量,惩罚算法的假阴性,例如当算法错过应该预测的事件时,公式为:(真阳性)/(真阳性 + 假阴性),一个对任何表述都从不预测“reset password”意图的助手永远不会有“reset password”的假阳性检测,但召回率会很差。
Repository (source code repository)(代码仓库;源代码仓库)
存储和版本控制源代码文件的地方,GitHub是一个流行的源代码仓库。
Reprompting(重新提示)
当对话式人工智能承认不理解用户的请求并要求他们重新表述时。
Response(响应)
用户向助手发送表述后,助手返回给用户的任何内容。
Rule - based(基于规则的)
一种传统的编程方法,将明确的规则编码到软件系统中,基于规则的编程是刚性和可预测的,但随着规则的增加会变得越来越复杂和脆弱。
Self - service AI assistant(自助式人工智能助手)
用户直接与人工智能助手交互的模式。
Sentence error rate(句子错误率)
评估语音转文本转录准确性的方法,句子错误率是有错误的句子数量与句子总数的比率。
Skill(技能)
包含对话配置的对话式人工智能组件。
Slots(槽位)
一种动态捕获完成任务所需信息的方法,信息可以在任何时间以任何顺序收集,当信息缺失时,会提示用户提供,创建约会是使用槽位的一个好例子,约会需要日期、时间和地点,用户可以说“I need an appointment for Elm on Tuesday at 3 p.m.”(一次填充所有槽位)或“I need an appointment”(不填充任何槽位,因此助手会询问额外问题直到所有槽位都被填充)。
SMART goal setting(SMART目标设定)
一种设定目标的方法,增加了目标实现的可能性,定义有所不同,但流行的SMART首字母缩写扩展为具体(Specific)、可衡量(Measurable)、可实现(Achievable)、相关(Relevant)和有时限(Time - bound)。
Source control management (SCM)(源代码管理)
跟踪和管理一系列文件(特别是源代码文件)的更改,Git是一个流行的源代码管理系统。
Speech adaptation / speech customization(语音适配;语音定制)
构建新的自定义语音转文本模型的过程,该模型通过自定义数据扩展基础模型。
Speech - to - text(语音转文本)
将音频输入转换为文本输入的算法,语音转文本服务内部识别部分单词声音(音素)并将它们组合成逻辑单词组,也称为语音识别。
Success metric(成功指标)
用于衡量人工智能助手是否满足其创建者需求的离散指标,成功指标使整个团队围绕成功的共同愿景保持一致。
Successful containment(成功处理率)
由人工智能助手完全处理且助手成功完成用户目标的对话百分比,以“reset my password”开始的对话只有在用户成功重置密码时才被视为已处理。
Supervised learning(监督学习)
一类机器学习算法,算法被给予输入及其相关的输出(标签),并被训练以推断将输入转换为输出的关系和规则,监督学习算法需要以标注数据形式的真实数据。
Synonyms(同义词)
在人工智能助手实体的上下文中,同义词是可以被视为等效的单词或短语,例如“User ID”、“UserID”和“User Identifier”可以被视为同义词。
Synthetic data(合成数据)
并非来自真实用户的数据,合成数据通常由主题专家根据他们对用户可能如何与系统交互的记忆或洞察创建。
Test data(测试数据)
模型未明确训练过的数据,因为模型没有见过这些数据,可以认为它对这些数据是盲目的,测试集通常称为盲测集,模型的真正测试是它对未见过的数据进行准确预测的能力(这将在生产中发生),测试集是近似这种情况的一种方便方法。
Test environment(测试环境)
团队在将代码发布到生产环境之前进行测试的内部场所。
Two - strikes / three - strikes rule(两击/三击规则)
借鉴自棒球的隐喻,在棒球中,击球手挥棒未击中称为一击,如果人工智能助手误解用户,我们可以称之为一击,如果助手误解用户三次(或两次,在两击规则中),助手应该将用户转接给其他渠道以解决问题。
Time to resolution(解决时间)
用户请求帮助到用户得到该请求的解决之间的时间。
Training data(训练数据)
用于训练自定义机器学习模型的数据集,训练数据的每一行通常包含一个输入和一个标注的输出(标注的输出是输入的答案)。
Transcription(转录)
从音频流中提取文本的过程。
True negative(真阴性)
对应默认情况的正确预测,如果用户的表述不包含意图,而助手以后备条件响应,这是一个真阴性,例如用户在输入“I can’t log in”时打错字,意外提交了“I can”作为表述,该语句不包含意图。
True positive(真阳性)
非默认情况的正确预测,如果用户要求重置密码,而助手检测到重置密码意图,这是一个真阳性。
Unsupervised learning(无监督学习)
一类机器学习算法,算法只被给予输入并被要求识别数据中的关系,算法将发现自己的推断,这些推断不太可能与预期的推断完全一致。
User persona(用户角色)
一个虚构的角色,旨在涵盖应用程序用户的角色和特征,例如一个精通技术的用户,更喜欢使用智能手机上的应用程序在线购物。
Utterance(表述)
用户向人工智能助手输入或说出的任何内容。
Wake word(唤醒词)
激活人工智能助手并告诉它开始监听命令的单词或短语,著名的唤醒词包括亚马逊的“Alexa”、谷歌的“OK Google”和苹果的“Hey Siri”。
Word error rate(单词错误率)
评估语音转文本转录准确性的指标,单词错误率是模型转录中错误单词的数量与正确转录中单词数量的比率。
通过对这些术语的详细解释,我们可以更深入地理解人工智能和机器学习领域的相关概念和技术,为进一步的学习和应用打下坚实的基础。