自然语言处理之机器翻译:BERT-based Models:机器翻译评估方法与指标
自然语言处理与机器翻译概览
自然语言处理的基本概念
自然语言处理(Natural Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究如何处理和运用自然语言;自然语言认知则是指让计算机“懂”人类的语言。NLP建立于20世纪50年代,随着计算机技术的飞速发展,NLP技术在信息检索、文本挖掘、语音识别、机器翻译等领域得到广泛应用。
词法分析
词法分析是NLP的基础,它将文本分解成单词或标记,例如,将句子“我喜欢吃苹果”分解为“我”,“喜欢”,“吃”,“苹果”。
句法分析
句法分析是分析句子结构的过程,例如,确定“我”是主语,“喜欢”是谓语,“吃”是动词,“苹果”是宾语。
语义分析
语义分析是理解文本意义的过程,例如,理解“我喜欢吃苹果”意味着“我”对“吃苹果”有正面的情感。
机器翻译的历史与发展
机器翻译(Machine