最近做的数据产品非常垃圾,在此作出总结和反思
1、老板不是数据产品的专家
- 通常在小公司,老板就是【产品经理+业务砖家】。
- 当初老板主导了一款功能产品成功上线,在此基础上投资第二款数据产品。
老板在功能产品上亲历亲为,而在数据产品上,既不太懂,也不懂管,只能给大方向,给不到准确的细分目标。
数据产品的核心是数据!
打造一款数据产品,到底是要大而泛还是小而精
?
如果是做宏观分析,则需要数据量大。
如果是具体应用,则要求小而精准
。
2、缺少业务专家
- 老板不是数据产品业务专家的情况下,就必须要招聘一位业务专家以及数据产品经理。
- 然鹅老板对业务专家这个角色的投入不够!起初聘请外部顾问作为兼职,后来才招聘正式的业务人员,而这个业务人员远远达不到专家水平。
- 另外,团队构成不完整;完整AI团队至少有:AI产品经理、业务专家、数据标注员、软件工程师、AI工程师
3、个人失误
- 本人作为唯一具有数据产品经验的工作人员,并未能主导产品走向。
3.1、没有快速学习业务
- 程序员起初以技术学习为主,忽视业务重要性。
3.2、人生大事
- 项目初期,个人耗费大量精力去相亲,未能全心投入工作,错过项目前期的很多关键决策。
- 没有说服领导贯彻【空间换时间】,硬盘始终没扩容。
- 没有说服领导使用【定制爬虫】;使用【业务人员+通用爬虫】导致数据源头垃圾过多,筛选成本过高。
4、NLP工程师发展困境
- 技术瓶颈:TensorFlow、PyTorch、句法分析、搜索引擎、数据仓库、知识图谱、大数据、Web框架
- 底子不够:高数、文献阅读能力
- 改不了 比Python更底层的代码
- 业务支持低
- 缺乏标注数据
- NLP算法应用场景窄、技术通用性低于传统后端
- NLP项目落地难度高
- Python速度慢、部署bug多
- 非科班出身
暂定可提升方向
1、算法:机器学习、深度学习、自然语言处理、搜索引擎、推荐系统、知识图谱、语言学…
2、工程:数据库、GitHub、Web开发、Linux、大数据、数据仓库…
3、业务:经济、金融、会计、工商管理、房地产…