谈起人工智能(Artificial Intelligence),英文缩写 AI,人们理解模糊、众说纷纭、喜忧参半,乐观者认为它极大地推动了产业界的进展,是目前乃至未来引领科技前沿的硬核方向之一,悲观者认为即使在某些场景它能解决很多问题,但它所引起的道德问题、伦理问题、失业问题、隐私问题已引起了很多民众的焦虑。而绝大多数民众对它的理解,仅限于“它很热”。的确,近期对于 ChatGPT 的报道与讨论更是强化了乐观者的乐观与悲观者的焦虑,也更是强化了绝大多数民众的认识— “它很热”。 那么什么是人工智能[1][2][3][4]呢?通识的理解,它可以拆成两部分—“人工”和“智能”[1][2]。“人工”就是指“人造的科学和工程的产物”,“智能”就宽泛多了,在研究领域,它主要包含思维、意识过程的模拟以及推理。合起来呢,就可以理解为像人一样的思考的科学和工程的产物。对人来说呢,人吸收信息能整理总结沉淀成知识,也能直接接收知识再综合信息来进行推理和决策。那对于人工智能呢,它的思想也是类同的,它既有信息、 知识性的、只能在设计的程序范围内形成动作的,不具备推理能力、独立意志的弱人工智能,又有在设计的程序 范围外能独立推理及自主决策的强人工智能。下图为作者编辑合成的选自百度图片中的“人工智能”图片。
人工智能是计算机科学的一个分支,该领域的研究从应用层面包含图像分析与理解[5][6]、语音识别理解与合成[7][8][9]、自然语言处理和理解[10][11]、搜索系统、推荐系统[12][13] 、专家系统[14][15]、脑机接口[16][17]、机器人[18][19]、自动驾驶[20][21]、无人机[22][23]和无人船等。下图呈现了我认为各应用的交叉情况。
图像分析与理解中,又包含图像分类、图像识别/检测、图像分割、图像检索,现在我们认证中用到最多的车牌识别、文字识别、人脸识别、指纹识别、字体识别都是图像识别中的细分领域。图像分割在医疗领域应用比较多,比如对CT图像和核磁共振扫描图像中感兴趣的区域进行分割等。在搜索平台可以通过关键字搜索图片,在电商购物平台中已有“以图搜图”应用。语音识别与理解系统还没有发展的很完善,但是应用却已经很广泛,比如小米的小爱同学、苹果的Siri、TCL电视中的小T、小汽车中的语音识别系统和电话客服系统都已经产生了辅助的价值。语音合成,一种会带来机遇与风险并存的技术[24][25],选好适合的应用场景尤为重要。下两图为分别说明图像分析与理解的细分领域和语音识别与理解—Siri助手的功能而编辑合成的选自百度的图片。
说到自然语言处理和理解,它们都既像是技术,又像是应用。说它们是技术,是因为它们也部分支撑着语音识别与合成、搜索系统、推荐系统和专家系统。说它们是应用,是因为它们由机器学习、深度学习、关键词提取算法、关键词排序算法、向量化算法等多种算法作为支撑。谈到搜索系统,我们再熟悉不过了,必应、百度、电商中的搜索、音/视频中的搜索,我们大多数人天天都在用吧。说到推荐系统,电商平台、读书、音/视频平台也应用得很广泛了。说到专家系统,其实所有的搜索系统和推荐系统也都是专家系统。但是之所以单列出专家系统,我认为主要是为没有规律、没有统一的解决方案、又依赖于专家的知识和经验而设计的解决方案的系统。最近异常火爆的ChatGPT[26]就是自然语言处理与理解、专家系统、搜索系统、推荐系统的集大成者,也同样是备受讨论与争议者[27][28]。
谈到脑机接口,它已不单单是科幻片里才有的呈现,在2020