2.商业问题和数据科学解决方案
基本概念:一系列数据挖掘任务
主要工具:数据挖掘过程;有监督和无监督数据挖掘
从商业问题到数据挖掘任务
监督VS非监督理论
数据挖掘和其结果
数据挖掘过程
业务理解
数据准备
建模
评估
部署
管理数据科学团队的内涵
其他分析技术和技巧
统计
数据库查询
数据仓库
回归分析
机器学习和数据挖掘
用这些技巧回答业务问题
总结
第二章 商务问题和数据科学解法
基本概念:一套权威数据分析任务;数据挖掘过程;监督和非监督数据挖掘
一个重要的数据科学原则就是数据挖掘是一个有着十分好理解的阶段的过程。一些人参与信息技术的应用,比如自动发现和评估从数据中找到的模式,而其他人大多数需要一个分析师的创造力,业务知识和常识。理解这整个过程帮我们很好的构建一个数据挖掘项目,所以这接近系统分析而不是靠基于和个人敏锐驱动的英雄般的努力。
但是也要注意,以上所说的系统分析过程更像是次发过程,始发过程是最需要创造力的。也是最需要个人英雄的。通常,创造都是有个人点发的,而不是集体。因此,尊重和欣赏个性也同样重要。这就是阴阳思维,道的思维。系统工程。
**
我想起了以前看过的关于钱学森,马斯克和乔布斯的访谈,他们是人们心中的英雄,但是他们全都谈到了一点,就是人们喜欢偶像,喜欢英雄,所以他们更爱关心英雄本身的传奇,而不是整个团队。无论是东风火箭,猎鹰九号,还是苹果手机,都是团队协作的系统工程。
我以前也是过与关注个人英雄,而忽视了这个系统。

本文是《商业数据分析》读书笔记的第二部分,深入探讨了数据分析流程,包括商业问题转化为数据挖掘任务,监督与非监督学习的理论,以及数据挖掘的主要步骤:业务理解、数据准备、建模、评估和部署。强调了团队合作和系统工程在数据科学中的重要性,并介绍了分类、回归等关键数据分析技术。同时,提出了数据科学项目与软件开发项目的区别,指出数据科学的本质是科学探索,需要好奇心和分析能力。
最低0.47元/天 解锁文章
611

被折叠的 条评论
为什么被折叠?



