自然语言处理之机器翻译:Phrase-Based Machine Translation(PBMT):短语翻译模型
自然语言处理与机器翻译简介
自然语言处理的基本概念
自然语言处理(Natural Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究如何处理和运用自然语言;自然语言认知则是指让计算机“懂”人类的语言。NLP建立于20世纪50年代,随着计算机技术的飞速发展,NLP技术在信息检索、文本挖掘、自动文摘、情感分析、机器翻译、问答系统、语音识别、语音合成等众多领域得到了广泛的应用。
术语解释
- 分词(Tokenization):将文本切分成单词或短语的过程。
- 词性标注(Part-of-Speech Tagging)<