在入门的阶段最适合做的事情:
(1)阅读和学习自然语言处理(natural language processing,nlp)综述类文章和图书,对nlp有一个基本的认识,梳理nlp研究内容的演变,包括nlp从诞生到多次繁荣发展和多次停滞不前的原因,正确认识nlp与人工智能、机器学习、自然语言理解、计算语言学、文本挖掘等概念之间的区别与联系(除了我下面推荐的图书、文章和代码,一定要多百度和google寻找学习资料);
(2)做一些非常简单的nlp入门小任务,通过小任务理解自然语言处理的流程(包括中英文nlp处理流程的差别);
(3)快速学习一门开发nlp技术的编程语言(基本就是python了,不需要学习网络编程等部分,重点掌握python基本语法、文件读写与编码、正则表达式、gensim、numpy、pandas、matplotlib等的使用);
(4)学习机器学习的相关概念,如:模型评估与选择、有监督学习、半监督学习、无监督学习、强化学习、迁移学习(只需要学习和认识其原理,做到心中有数即可);
(5)关注各大内容大V,如:微信公众号(paperweek