一、机器学习相关的公司分析
1、BATJ
这类公司主要是百度,阿里和腾讯。共同的特点是数据很大,机器学习的团队比较庞大,一般进去的同学都可以有师傅带着学习,进步会比较快。
2、middle level
当当,携程,去哪儿,360,58同城,优酷,乐视。
一是业务挖掘类岗位,另外就是推荐和广告算法的团队。这类公司具有市场地位不够稳固,机器学习团队相对较弱或者较新的特点。
广告算法工程师。
3、Started level
今日头条(主要需要的是文本挖掘,推荐等人才)
二、机器学习相关职位分析
1、互联网业务挖掘
使用的主要数据和要解决的问题,初级的业务挖掘人员的工作会离数据和算法更近;高级的业务挖掘人员
会离用户和业务更近。“数据挖掘工程师”等。
三产业:车辆调度:蚁群算法;
2、推荐算法
解决的核心问题是给用户想要的,不要给用户不想要的,降低用户找东西的难度,给用户更多的惊喜。
不同的互联网产品在不同的阶段,可以通过推荐系统解决不同的问题和实现不同的目标。
职位的设置情况和需求趋势:
相对业务挖掘岗位,有推荐算法职位的公司数量相对比较少。能够看到的一些公司如下。
电商:淘宝,当当,京东,口袋购物。
视频:优酷土豆,爱奇艺,风行在线,乐视。
音乐:豆瓣,虾米,网易云音乐,百度。
新闻APP:今日头条,网易新闻客户端,百度新闻,指阅。
阅读:盛大文学,掌阅科技。
团购:美团,糯米。
社交:微博,linkedin。
手机助手:豌豆荚,
LBS推荐:百度,高德。
相对电脑,手机的私密性更强,屏幕资源更小,可能会有更多的移动应用公司会部署推荐算法的岗位。
4、NLP
使用的数据主要是人们日常随意写出来的或者说出来的话。比如新闻,文章,微博上的话,qq的聊天,
贴吧里的话,博客上的话,企业呼叫中心的对话等。
要解决的问题主要是对这些内容进行抽象,映射或者响应。比如信息抽取(命名实体识别,情感分析等
),机器翻译,聚类,分类,自动问答等。
5、图像处理
使用的数据和要解决的问题:
参考《Computer Vision:Algorithms and Applications.Richard Szeliski》,
《Multiple_View_Geometry_in_Computer_Vision__2nd_Edition》
面对的数据是图像,具体也会有处理静态图像和动态视频的区别。以及离线处理和在线处理的区别。
检测(就是看某个图片里是否有某类东西,比如是否有人脸)
识别(就是输入 一个图片,看这个图片和库里的哪个图片是一致的。)
分割,
拼接,3
D重建,聚类,分类