- 博客(7)
- 资源 (1)
- 收藏
- 关注
原创 数据仓库简介-ODS、DW和DM概念区分
一、什么是数据仓库数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。数仓的数据来源一般有:日志采集系统、业务系统数据库、爬虫系统等。通过对数据仓库中的数据进行分析,可以帮助企业改进业务流程、控制成本、提高产品质量等。举例:对于一个电商App,数据显示对于进入支付页面的用户,只有30%进行了支付,这是一个反常的数据。这个时候产品经理进行分析,发现支付按钮的...
2020-03-28 10:56:43
13841
原创 当智能时代来临,我们需要懂点计算机思维
听前谷歌专家吴军博士讲述的什么是计算机思维,非常受启发,把自己的理解写下来和大家进行分享。内容涵盖的面很多,捡重要的来说,计算机思维主要有三个重点:讲量级、多维度、模块化。目录一、讲量级二、多维度三、模块化一、讲量级我们说的量级,就是指类似芝麻、桔子、西瓜之间大小的差别,差距都在十倍或者百倍。为什么要讲量级呢,因为不同量级,我们做事的方式完全不一样,需要的...
2019-04-07 14:59:33
397
原创 人工智能100问 - 5 什么是准确率、召回率、 F 值、 ROC 曲线、 AUC?
当我们训练好一个模型,如何衡量它的好坏呢?这个时候我们需要一系列的数量化的指标,通过这些指标的高低,对模型的优劣进行判断。一、准确率和召回率准确率和召回率是每个模型都会去看的指标。准确率 = 选出的正确信息条数 / 选出的信息总条数 召回率= 选出正确信息条数 / 样本中的信息条数举个栗子,我们有100个苹果有90个是好的,10个是坏的。我们弄了一个算法来找出坏的苹果。我们...
2019-03-21 14:04:01
2485
原创 人工智能100问 - 4 什么是逻辑回归和线性回归?他们有什么区别?
一、什么是线性回归(Linear regression)?首先我们要了解,什么是回归?我们认为所有的特定组数据是相关的,符合一定的分布规律(可以想象成各种曲线),而回归就是来确定这个曲线的参数从而确定这个曲线(曲线可以用数学函数来表示)。继而我们可以根据确定的函数和要预测的一组x值,来计算新的数据的结果,这个结果就是我们要预测的x值对应的y值。简单来说,回归是一种拟合数据的方法。第二步...
2019-03-13 20:23:13
1856
原创 人工智能100问 - 3极大似然法是什么?与最小二乘的区别?
我们用机器学习做模型,需要确定模型的各个参数。模型实际的参数我们是无从得知的,我们只能尽最大可能对这些参数进行估计,极大似然法就是使用最广泛的估计方法之一。一、什么是极大似然?极大似然估计从字面上来理解可以拆成三个词,分别是“极大”、“似然”、“估计”,分别的意思如下:极大:最大的概率似然:看起来是这个样子的估计:就是这个样子的连起来就是,最大的概率看起来是这个样子的那就是这个样子...
2019-03-11 21:23:16
695
原创 人工智能一百问-2深度学习里说的激活函数是什么意思?
文章目录一、Sigmoid函数二、Tanh函数三、ReLU函数四、Softplus函数五、Softmax函数六、Swish 函数七、我们应该如何选用合适的激活函数?很多刚刚接触深度学习的朋友,在看书籍、博文的时候,经常会看到一个名词:激活函数。那激活函数到底是干什么的呢?实际上激活函数并不是真正用来“激活”什么的,而是用来对神经元计算出来的结果进行计算和处理的。目的是把特征保留下来,去除数...
2019-03-09 15:00:46
541
原创 人工智能一百问-1无监督、有监督、半监督、强化学习都是什么意思?有哪些区别?有哪些比较有代表性的算法?常见的应用场景有哪些?
他们的区别,无监督是训练集没有标准答案;监督学习是训练集都有标准答案;半监督学习是一小部分训练集有标准答案,大部分训练集没有标准答案;强化学习是给到奖励或惩罚的刺激,通过试错和反馈来进行学习。一、监督学习监督学习是指对已经打好标签的训练样本进行学习,目标是对训练样本集之外的数据进行预测的学习方式。比如我们高考做考试题,标准答案已经有了,我们只需要记住这些答案,下次碰到了,知道1+1应该是...
2019-02-23 01:30:59
3437
gradle-2.3-all
2015-03-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人