对于企业来说,数据来源网站、企业应用、社交媒体、物联网以及网联网产生的越来越多的数据,而数据挖掘就是数据分析中的重要环节之一。
数据挖掘是指通过算法搜索从大量数据中隐藏信息的过程。通过数据分析确定趋势和模式,建立关系,从而解决业务问题。换句话说,数据挖掘是从大量、不完整的、噪音的、模糊的、随机的数据中提取出来的。而人们事先不知道的是一种潜在有用的数据和知识过程。与以观察数据为重点的数据分析不同,数据挖掘的重点是从数据中发现知识规则数据分析得出结论,应用是人类的智力活动,而数据挖掘发现的知识规则可以直接应用于预测。
数据挖掘的基本步骤
1)数据清理:消除噪声和不一致数据;
2)数据集成:不同来源与格式的数据组合到一起;
3)数据选择:挖掘所需的数据;
4)数据变换:数据变换成适合挖掘的形式,如汇总,聚集操作;
5)数据挖掘:方法,建模;
6)模式评估:结果模型;
7)知识表示:可视化。
数据挖掘应用价值:为企业生产销售做预测
数据挖掘的真正价值在于可以以数据中的模式和关系的形式挖掘隐藏的宝石,可以用来预测对企业的重大影响。比如一个公司确定某个特定的营销活动,导致某个特定型号的产品在国内某些地区销量很高,但在其他地区没有,那么以后可以重新调整广告活动,实现最大回报。
该技术的好处可能会因业务类型和目标而异。例如,零售业的销售和营销经理可能用不同的方式挖掘客户信息以提高转化率,这种提高转化率的方式迥异于航空公司或金融服务业。
不管是什么行业,过去应用于销售模式和客户行为的数据挖掘都可用于创建预测未来销售和行为的模型。数据挖掘也有助于取消可能损害企业的活动。例如,你可以使用数据挖掘来提高产品的安全性,或检测保险和金融服务交易中的欺诈活动。