4.5 再次更新
1.关于python学习第0阶段的总结
python本身(仅指python语法,脚本运行之类)的东西其实没有很多
之前找了本书过了一遍python的基础语法,结果在做一个基于直方图概率估计的朴素贝叶斯分类器的实现时都感觉困难。这期间遇到的最大的两个问题:
- 算法本身理解不到位(贝叶斯分类器如果采用无参估计,训练过程是什么?其实就是用训练集求概率)
- 原始数据的处理与归并(处理成合适的数据结构)
2.下一步的计划:补完python的数据结构和处理思想
3.对发展方向的思考
之前决定开始python的第0阶段,是因为有一个在瓜子二手车平台做数据分析的哥哥,在我问他研究生的方向时毫不犹豫地给我推荐了AI/机器学习的方向,("高端的AI人才还是很缺的"原话)
因为我本科专业是自动化,所以实际上如果不下大功夫学一下计算机的基础课,只能做算法的生产工(发展受限,且不确定因素太多)
今天在b站看到了一个在业工程师的视频分享,里面传达的意思是尽管弄出好的算法很酷,这个领域里顶尖的人也很让人崇拜,但是在一个机器学习的落地项目里,算法是太小太小的一个部分,一个算法的更换/改进可能还不如多收集一个特征.做整个工程的后端知识要求也很高,如何分布式存储数据,如何训练模型,是数据并行还是运算并行,以及最后的评估(不是损失函数,准确率),而是实际的用户增量,为什么增加了,为什么减少了,以及如何做出改进.
当然,这个是一个全局的东西,无论哪个行业都是这样,一个东西不可能喧宾夺主,环节之间互相依赖,但是搞机器学习,确实不是搞算法(其实搞控制也不是搞算法…),我只能说今天展开了对这个行业的理解
这么看来,需要做的东西就有 :
- 数学/算法
- 计算机(并行,通讯,后端)
- 数据处理分析思维训练
- 以及在更多领域的了解(经济,管理等)
(很浅薄以及缺乏经验的日记,如果真的有一个你看到了这里,或许你可以和我说点什么