Datawhale原创
作者:康兵兵,Datawhale成员
寄语:NLP入门,科学有效的方法是找到切入点,一个具体任务。从任务实践入手,做到既见树木也见森林。
笔者从2018年初开始接触机器学习,现在是某一线互联网公司的NLP算法工程师。从小白一步步走来,积累了一些学习和实践过程中的经验。现在,从个人情况、入门心得和案例分享三个方面,介绍一下NLP的入门经历和学习方法,希望能帮助到大家。
个人情况
1.0阶段
契机:一个关于空气质量预测的数据挖掘类项目
问题:对ML领域并不了解,没有能力完成一个项目,作为项目负责人更是无从下手。
解决办法
快速通读领域知识,对机器学习宏观认知。利用一天半时间,快速看完谷歌的机器学习速成课程;
阅读论文并了解现有解决方案。主要关注相关领域的综述论文;
查漏补缺,对理论知识进行迭代。遇到不清晰的概念回顾相关内容,加深理解;
了解、借鉴,最后根据实际数据和场景进行改进。
收获
基于auto-encoder结构完成了初版模型;
所用编程语言变动,从matlab、Tflearn ,到最后的DeepLearning4j;
主要对机器学习和深度学习相关概念有了初步了解和实践,为后边的实习、比赛和工作打下了基础。
2.0阶段
契机:“去哪儿”公司实习,参与“蜻蜓旅行”的内部孵化项目。项目背景是根据用户给定的出发地、目的地及出行日期区间,为用户推荐价格最低的航班班次,帮助用户更好的决策。
收获
机器学习相关内容,从rf到xgboost,再到lightgbm,还有facebook的prophet;
实际场景问题加深了理论理解,理论反过来指导了我的实践,如此循环,令人收益匪浅。
吐槽:日常加班,特别在几次发版的日子里,需要工作到凌晨两点。
3.0阶段
契机:小米实习,工作内容与大数据相关。同期也拿到了百度金融的offer,但因为没有做过大数据,想要尝试一下,最终选择了小米。
收获:<