
MADlib —— 基于 SQL 的数据挖掘解决方案
文章平均质量分 96
介绍分类、聚类、关联、回归、预测、模型评估等数据挖掘方法及其在MADlib 1.10.0版本上的具体实现示例。
wzy0623
30年专职DBA工作;OCP Oracle 8i DBA、MySQL 5 DBA、信息系统项目管理师;《Hadoop构建数据仓库实践》、《HAWQ数据仓库与数据挖掘实战》、《SQL机器学习库——MADlib技术解析》、《MySQL高可用实践》、《Kettle构建Hadoop ETL》、《Greenplum构建实时数据仓库实践》作者。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
MADlib —— 基于 SQL 的数据挖掘解决方案(9)—— 数据探索之概率统计
概率、MADlib 的概率相关函数、统计推论、MADlib 的假设检验、MADlib 假设检验示例原创 2025-06-10 09:37:27 · 534 阅读 · 0 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(4)—— 数据类型之矩阵
矩阵定义、MADlib 中的矩阵表示、MADlib 中的矩阵运算函数、矩阵与数据分析原创 2025-06-06 09:16:08 · 1287 阅读 · 0 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(1)—— 数据挖掘入门
什么是数据挖掘、数据挖掘与知识发现、数据挖掘的原理、数据挖掘的任务、数据挖掘的过程、识别数据类型原创 2017-12-19 11:09:30 · 20326 阅读 · 0 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(2)—— MADlib 基础
MADlib 简介、MADlib 支持的模型类型、MADlib 的功能、安装与卸载 MADlib原创 2017-12-19 17:22:04 · 12762 阅读 · 1 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(3)—— 数据类型之向量
向量定义、MADlib 中的向量操作函数、稀疏向量、向量与数据分析原创 2017-12-22 15:56:56 · 2296 阅读 · 0 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(5)—— 数据转换之邻近度
邻近度的度量、MADlib 的邻近度相关函数、距离度量的中心化和标准化、选取正确的邻近度度量原创 2017-12-29 18:45:57 · 2066 阅读 · 0 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(6)—— 数据转换之矩阵分解
低秩矩阵分解、奇异值分解原创 2018-01-04 17:30:41 · 2258 阅读 · 3 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(7)—— 数据转换之其他转换
透视表、分类变量编码、词干提取原创 2018-01-09 09:57:10 · 1540 阅读 · 0 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(8)—— 数据探索之描述性统计
皮尔森相关、汇总统计原创 2018-01-16 13:11:44 · 2244 阅读 · 0 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(10)—— 数据探索之主成分分析
主成分分析简介、MADlib 的 PCA 相关函数、PCA 应用示例原创 2018-01-25 14:55:40 · 2924 阅读 · 0 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(11)—— 回归之线性回归
回归方法简介、一元线性回归、多元线性回归、MADlib 的线性回归相关函数、线性回归示例原创 2018-01-29 16:21:35 · 4065 阅读 · 3 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(12)——回归之广义线性模型
广义线性模型简介、MADlib 广义线性模型相关函数、示例原创 2018-01-30 14:38:44 · 1548 阅读 · 1 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(13)—— 回归之逻辑回归
逻辑回归简介、MADlib 的逻辑回归相关函数、逻辑回归示例原创 2018-01-31 15:09:30 · 3172 阅读 · 0 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(14)—— 回归之多类回归
多类回归简介、MADlib 的多类回归函数、示例原创 2018-02-01 14:15:21 · 1048 阅读 · 0 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(15)—— 回归之序数回归
序数回归简介、MADlib 的有序回归相关函数、示例原创 2018-02-02 13:42:51 · 3833 阅读 · 0 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(16)—— 回归之弹性网络回归
弹性网络回归简介、MADlib 的弹性网络回归相关函数、简单示例、分组示例、比较 coef_nonzero 与 coef_all、交叉验证示例原创 2018-02-05 16:32:17 · 2728 阅读 · 0 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(17)—— 回归之 Cox 比例风险回归
Cox 比例风险回归简介、MADlib 中 Cox 比例风险回归相关函数、示例原创 2018-02-06 11:39:18 · 5382 阅读 · 0 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(18)—— 回归之稳健方差
稳健线性回归训练函数、稳健逻辑回归训练函数、稳健多类逻辑回归函数、Cox 比例风险稳健方差函数、示例、技术背景原创 2018-02-07 14:56:36 · 1569 阅读 · 0 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(19)—— 回归之聚类方差
聚类方差线性回归训练函数、聚类方差逻辑回归训练函数、聚类方差多类逻辑回归训练函数、Cox 比例风险模型的聚类方差、示例、技术背景原创 2018-02-08 13:45:39 · 1339 阅读 · 0 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(20)—— 时间序列分析之 ARIMA
时间序列分析简介、ARIMA 模型、MADlib 中 ARIMA 相关函数、示例原创 2018-02-11 15:36:26 · 3524 阅读 · 0 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(21)—— 分类之 KNN
分类方法概要、K 近邻简介、MADlib 中的 KNN 函数、示例原创 2018-03-05 11:06:26 · 4576 阅读 · 0 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(22)—— 分类之朴素贝叶斯
贝叶斯分类简介、MADlib 中朴素贝叶斯分类相关函数、示例原创 2018-03-06 14:49:24 · 2162 阅读 · 1 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(23)—— 分类之 SVM
SVM 简介、MADlib 中 SVM 相关函数、示例原创 2018-03-08 10:52:11 · 4499 阅读 · 2 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(24)—— 分类之决策树
决策树简介、MADlib 的决策树相关函数、决策树示例原创 2018-03-10 09:26:18 · 4551 阅读 · 0 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(25)—— 分类之随机森林
随机森林简介、MADlib 的随机森林相关函数、随机森林示例原创 2018-03-12 18:14:48 · 2270 阅读 · 0 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(26)—— 聚类之 k-means 方法
聚类方法简介、k-means 方法、MADlib 的 k-means 相关函数、k-means 应用示例、小节原创 2018-03-13 12:36:44 · 4349 阅读 · 1 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(27)—— 关联规则之 Apriori 算法
关联规则简介、Apriori 算法、MADlib 的 Apriori 算法函数、Apriori 应用示例、小节原创 2018-03-14 10:42:17 · 2807 阅读 · 0 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(28)—— 图算法之单源最短路径
图算法简介、单源最短路径、MADlib 的单源最短路径相关函数、单源最短路径示例、小节原创 2018-03-15 11:01:28 · 1441 阅读 · 0 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(29)—— 模型评估之交叉验证
交叉验证简介、MADlib 的交叉验证相关函数、交叉验证示例、小节原创 2018-03-16 11:15:24 · 1981 阅读 · 0 评论 -
MADlib —— 基于 SQL 的数据挖掘解决方案(30)—— 模型评估之预测度量
预测度量、预测度量函数、参数、函数的具体细节、示例、参考文献原创 2018-03-16 11:36:37 · 1208 阅读 · 0 评论