文章目录 1、什么是nlp?2、NLP涉及的知识3、nltk库4、语料和词性标注5、分词6、IF-IDF(频率-逆文档频率) 1、什么是nlp? 自然语言处理( Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。 NLP的发展历程:NLP研究难点: 2、NLP涉及的知识 文本语言模型: 3、nltk库 4、语料和词性标注 5、分词 分词:把句子分成词。 Jieba分词 结果: 6、IF-IDF(频率-逆文档频率) 还可以自动提取关键词,自动摘要等