
数据分析
文章平均质量分 80
元宇宙开源博客
这个作者很懒,什么都没留下…
展开
-
数据分析系列之目录
数据挖掘系列前言和目录1.前言为什么我要开这个系列?我明白,未来会是数据的天下,就如区块链而言,它是目前无法单独去生存下去,而是与其他技术绑定,才能更好地发挥未来的作用.什么是数据分析?就拿区块链的挖矿类比来说,数据就是矿,如何从大量矿脉中挖掘有价值的矿石,并把这些矿石加工成工具,这就是数据分析.如何与区块链结合?在我的设计体系中,目前可以存在的运行模式就是数据爬虫从网络中获取信息,...原创 2019-08-28 13:03:56 · 814 阅读 · 0 评论 -
数据分析系列之数据挖掘基础
了解什么是数据挖掘1.假设背景1. 在传统企业现状,以连锁餐饮为例?今年来餐饮企业面临原材料上涨,房租上涨,人力成本升高的必然趋势,导致净利润大幅度下降,同时同业竞争的加剧的环境下,如何在保证产品的品质的基础下提高企业效率,成为当前餐饮企业必须解决的问题.2. 目前做了什么改变,有什么样的基础?餐饮企业目前通过企业信息化系统来提高效率,已具有的信息系统包括如下:1.客户关系管理系统:保...原创 2019-08-28 13:05:12 · 1093 阅读 · 0 评论 -
数据分析系列之Python数据分析简介
Python是一门简单易学且功能强大的编程语言,使其在许多领域成为编写脚本或开发应用程序理想语言.Python被称作"胶水语言",是由于其运行效率的问题,将程序核心部分由C++等高效率语言编写,然后各个部分由它粘合.我们在开发中如果是新手可以先选择Windows平台,后期可以迁移至Linux平台,Linux平台自带Python,而且更容易解决第三方库依赖问题.至于语言版本我推荐使用3.x版本....原创 2019-08-29 15:54:03 · 940 阅读 · 0 评论 -
数据分析系列之数据探索
根据观测,调查收集到的初步的样本数据集后,接下来要考虑的是样本的数据集的数量和质量是否满足模型构建的要求,是否出现从未设想过的数据状态?其中有什么明显的规律趋势,各因素之间有什么关联性?通过检验数据集的数据质量,绘制图表,计算某些特征量等手段,对样本数据进行规律性分析的过程就是数据探索.数据探索主要包括数据质量分析和数据特征分析.1.数据质量分析数据质量分析主要是检查原始数据中是否存在脏数据,...原创 2019-09-02 13:50:22 · 4916 阅读 · 0 评论 -
数据分析系列之数据预处理
在数据挖掘过程中,海量的原始数据存在大量的不一致,有缺失的数据,严重影响到数据挖掘的效率和准确率,数据清洗尤为重要,数据清洗之后进行或同时进行数据集成,转换,规约等一系列过程,该过程就是数据预处理.数据预处理一方面提高数据质量,另一方面使数据更好地适应特定的数据挖掘或者工具.1. 数据清洗数据清洗就是删除掉原始数据集中的无关数据,重复数据,平滑噪声数据,筛选掉与挖掘主题无关的数据,处理缺失值和...原创 2019-09-03 18:11:25 · 9689 阅读 · 0 评论 -
数据分析系列之挖掘建模
经过数据探索与数据预处理,得到了可以直接建模的数据,根据挖掘目标和数据形式可以建立分类与预测,聚类分析,关联规则,时序模式和偏差检测等模型,帮助企业提取数据中的商业价值.分类与预测对于之前的背景假设,餐饮企业会经常遇到如下问题:如何基于菜品历史销售情况,以及节假日,气候,竞争对手等影响因素,对菜品销量进行趋势预测?如何预测未来一段时间哪些顾客会流失,哪些顾客会最有可能成为vip?如何预...原创 2019-09-10 18:08:50 · 4215 阅读 · 0 评论 -
数据分析系列之电力窃漏电用户自动识别
在线监测用户用电负荷数据,经过数据预处理,得到模型输入数据,利用构建好的识别模型计算用户窃漏电诊断结果,实现窃漏电用户的实时诊断,并与实际稽查结果对比背景与挖掘目标 传统的防窃漏电方法主要是通过定期巡检,定期校验电表,用户举报窃电等方法来发现窃电或者计量装置故障,但这种方法对人依赖性太大,抓漏查漏的目标不明确.当前,供电局通过营销稽查人员,用电检查人员和计量工作人员利用计量异常报警功能和...原创 2019-09-12 15:58:57 · 6863 阅读 · 6 评论