
数据分析
文章平均质量分 50
数据分析的学习过程:不是按照书本的章节起的名字,是每天工作之余第一天就起之一这样类推来的
行路者-慢慢来
计算机改变自己
展开
-
网络爬虫学习记录
一、计算机网络基础原理实验步骤步骤1:在Pyhon中创建一个list,存储以下个人信息(姓名、年龄、成绩):[小王、40、50],[小贾、50、23]步骤2:将步骤1的数据存储为json格式,并进行读取步骤3:将步骤1的数据存储为xml格式,并进行读取步骤4:学习计算机网络基础,思考从打开coggle.club到网页展示,有什么步骤?将你的思考结果写到博客。二、HTTP协议原理实验步骤步骤1:学习HTTP协议步骤2:HTTP的get和post有什么区别?用处在哪儿原创 2022-03-01 13:40:02 · 567 阅读 · 0 评论 -
数据分析方法
将数据处理完以后,现在的数据已经说是比较完整了,没有了重复值,没有了缺省值,于是我们需要将数据展示出来,一百万对老板来说就是一个数字,对于我们来说要让这一百万说话,说出老板理解不到的声音,那就是使用数据分析方法去分析数据分析的三大作用:现状分析,原因分析,预测分析,对应三大分析方法:对比,细分,预测!!数据分析方法对比分析法:任何事物都是既有共性,又有个性。只有通过对比,才能分辨出事务的性...原创 2019-10-16 14:24:53 · 442 阅读 · 0 评论 -
数据分析方法论--确定数据分析的整体思路
PEST分析法作用:用于对宏观环境的分析指标:根据不同公司会有差异,但一般包括政治(Political),经济(economic),技术(technological)和社会(socail)政治环境:主要包括一个国家的社会制度,执政党的性质,政府的方针,政策,法令,关键性指标:政治体制,经济体制,财政政策,税收政策,产业政策,投资政策,专利数量,国防开支水平,政府补贴水平,民众对政治的参与度...原创 2019-10-15 11:12:30 · 370 阅读 · 0 评论 -
数据分析的基本思路与常用指标
数据分析的基本思路明确分析目的和思路做任何事情都要有明确的目的,目的在我们完成一件事情的过程中起到指导的作用,一切以解决问题为中心当分析目的明确后,我们就要梳理分析思路,并搭建分析框架,把分析目的分解为若干个不同的分析要点,也就是如何开展数据分析,就能够使分析 结构化和体系化结构体系化的方法营销方面的理论模型有4p,用户使用行为,STP理论,SWOT,管理方面的理论模型有PEST,5...原创 2019-10-14 13:50:48 · 830 阅读 · 0 评论 -
读《python数据挖掘与分析实战》之九
决策树决策树是一树状结构,它的每一个叶节点对应着一个分类,非叶节点对应着在某个属性上的划分,根据样本在该属性上的不同取值将其划分成若干个子集。对于非纯的叶节点,多数类的标号给出到达这个节点的样本所属的类。构造决策树的核心问题是在每一步如何选择适当的属性对样本做拆分。对一个分类问题,从已知类标记的训练样本中学习并构造出决策树是一个自上而下,分而治之的过程。ID3算法简介及基本原理ID...原创 2019-06-10 10:12:29 · 267 阅读 · 0 评论 -
读《python数据挖掘与分析实战》之八
挖掘建模经过数据探索与数据预处理,得到了可以直接建模的数据,根据挖掘目标和数据形式可以建立分类与预测,聚类分析,关联规则,时序模式和偏差检测等模型,帮助企业提取数据中蕴含的商业价值,提高企业的竞争力分类与预测分类和预测是预测问题的两种主要类型,分类主要是预测分类标号(离散属性),而预测主要是建立连续值函数模型,预测给定自变量对应的因变量的值实现过程(1)分类 分类...原创 2019-06-05 15:10:53 · 293 阅读 · 0 评论 -
读《python数据挖掘与分析实战》之七
python主要数据预处理函数每一个函数的使用可以自行百度,这里就不记录了,书上介绍还是挺全面的!!!小结本章介绍了数据预处理的4个主要任务:数据清洗,数据集成,数据变换和数据规约。数据清洗主要介绍了对缺失值和异常值的处理,处理缺失值的方法分为三类:删除记录,数据插补和不处理,处理异常值的方法有删除含有异常值的记录,不处理,平均值修正和视为缺失值;数据集成是合并多个数据源中的数...原创 2019-06-05 11:26:13 · 269 阅读 · 0 评论 -
读《python数据挖掘与分析实战》之六
数据规约在大数据集上进行复杂的数据分析和挖掘需要很长的时间,数据规约产生更小但保持原数据完整性的新数据集。在规约后的数据集上进行分析和挖掘将更有效率数据规约的意义:1.降低无效,错误数据对建模的影响,提高建模的准确性。2.少量且具代表性的数据将大幅缩减数据挖掘所需的时间,3.降低存储数据的成本属性规约通过属性合并来创新属性维数,或者直接通过删除不相关的属性(维)来减少数据维数,从而...原创 2019-06-04 11:11:17 · 254 阅读 · 0 评论 -
读《python数据挖掘与分析实战》之五
接上一篇异常值处理在数据预处理,异常值是否剔除,需视具体情况而定,因为异常值可能蕴含着有用的信息将含有异常值的记录直接删除的方法简单易行,但缺点也很明显,在观测值很少的情况下,这种删除会造成样本量不足,可能会改变变量的原有分布从而造成分析结果的不确定,视为缺失值处理的好处是可以利用现有变量的信息,对异常值进行填补数据集成数据挖掘需要的数据往往分布在不同的数据源中,数据集成就是将...原创 2019-06-03 09:04:13 · 708 阅读 · 0 评论 -
拉格朗日插值法(图文详解)
在数值分析中,拉格朗日插值法是以法国十八世纪数学家约瑟夫·拉格朗日命名的一种多项式插值方法。许多实际问题中都用函数来表示某种内在联系或规律,而不少函数都只能通过实验和观测来了解。如对实践中的某个物理量进行观测,在若干个不同的地方得到相应的观测值,拉格朗日插值法可以找到一个多项式,其恰好在各个观测的点取到观测到的值。这样的多项式称为拉格朗日(插值)多项式。数学上来说,拉格朗日插值法可以给出一个恰好穿...原创 2019-05-31 16:34:48 · 2578 阅读 · 0 评论 -
读《python数据挖掘与分析实战》之四
数据预处理在数据挖掘中,海量的原始数据中存在着大量不完整,不一致,有异常的数据,严重影响到数据挖掘建模的执行效率,甚至可能导致挖掘结果的偏差,所以进行数据清洗就显得尤为重要,数据清洗完成后接着进行或者同时进行数据集成,转换,规约等一系列的处理,该过程就是数据预处理。数据预处理一方面是要提高数据的质量,另一方面是要让数据更好地适应特定的挖掘技术或者工具。数据预处理的主要内容包括数据清洗,数据...原创 2019-05-31 11:07:09 · 344 阅读 · 0 评论 -
读《python数据挖掘与分析》之三
数据探索数据质量分析1. 数据质量分析的主要任务是检查原始数据中是否存在脏数据(不符合要求,不能进行相应分析的数据)包括以下1.缺失值,2.异常值,3.不一致的值,4.重复数据及含有特殊符号的数据缺失值分析:1.缺失值主要包括记录的缺失和记录中某个字段信息的缺失,两者都会造成分析结果的不准确 缺失值产生的原因:1.分析前无法获取的信息,或者信息的代价太大。2.有些信息是被遗漏的。3...原创 2019-05-29 16:06:55 · 295 阅读 · 0 评论 -
读《python 数据分析与挖掘实战》之二
python数据分析工具介绍:原创 2019-05-29 16:00:50 · 230 阅读 · 0 评论 -
读《python 数据分析与挖掘实战》之一
数据挖掘的基本任务数据挖掘的基本任务包括利用分类与预测,聚类分析,关联规则,时序模式,偏差检测,智能推荐等方法,帮助企业提取数据中蕴含的商业价值,提高企业的竞争力。数据挖掘建模过程定义挖掘目标针对具体的数据挖掘应用需求,首先要明确本次挖掘目标是什么?系统完成后能达到什么样效果?数据取样明确了需要进行数据挖掘的目标后,接下来就需要从业务系统中抽取一个与挖掘目标相关的样本数据子集。抽取数...原创 2019-05-29 11:00:37 · 263 阅读 · 0 评论 -
数据分析入门
数据分析的种类描述性数据分析:属于初级数据分析,常见的分析方法有对比分析法,平均分析法,交叉分析法探索性数据分析和验证性数据分析:属于高级数据数据分析,常见的分析方法有相关分析,因子分析,回归分析,这部分就是人工智能的线性回归呀,等一些数据分析在公司的...原创 2019-10-09 14:02:05 · 229 阅读 · 0 评论 -
数据分析方法论和数据分析的方法
数据分析方法论就相当于衣服的设计图纸,数据分析的方法就相当于制作一个完整的衣服我们需要使用剪刀裁剪,使用缝纫机缝纫,使用熨斗去熨衣服原创 2019-10-10 08:59:48 · 199 阅读 · 0 评论