
Machine Learning
文章平均质量分 94
数据架构
知识就是力量,良知才是方向。良知比知识更重要!
When you want to give up , think about why you started?
千学不如一看,千看不如一练,千练不如一战
ACDU(中国DBA联盟)成员
安徽DBA俱乐部 成员
展开
-
About More Predictive Modeling Projects
About More Predictive Modeling Projects原创 2022-05-31 08:50:57 · 141 阅读 · 0 评论 -
How to do Binary Classification Machine Learning Case Study Project
How to do Binary Classification Machine Learning Case Study Project原创 2022-05-30 21:57:43 · 454 阅读 · 0 评论 -
How to work through Regression Machine Learning Case Study Project
How to work through Regression Machine Learning Case Study Project原创 2022-05-30 15:36:37 · 232 阅读 · 0 评论 -
My First Machine Learning Project in Python Step-By-Step
My First Machine Learning Project in Python Step-By-Step原创 2022-05-29 22:37:59 · 303 阅读 · 0 评论 -
How to structure predictive Modeling Project Template
How to structure predictive Modeling Project Template原创 2022-05-29 16:48:36 · 187 阅读 · 0 评论 -
How to Save and Load Machine Learning Models
How to Save and Load Machine Learning Models原创 2022-05-29 14:34:18 · 231 阅读 · 0 评论 -
How to Improve Performance with Algorithm Tuning
How to Improve Performance with Algorithm Tuning原创 2022-05-29 08:18:03 · 170 阅读 · 0 评论 -
How to Improve Performance with Ensembles
How to Improve Performance with Ensembles原创 2022-05-29 07:16:27 · 198 阅读 · 0 评论 -
How to use Automate Machine Learning Workflows with Pipelines
How to use Automate Machine Learning Workflows with Pipelines原创 2022-05-28 21:39:45 · 113 阅读 · 0 评论 -
How to Compare Machine Learning Algorithms
How to Compare Machine Learning Algorithms原创 2022-05-28 20:05:56 · 281 阅读 · 0 评论 -
How to Spot-Check Regression Algorithms
How to Spot-Check Regression Algorithms原创 2022-05-28 16:12:07 · 194 阅读 · 0 评论 -
How to Spot-Check Classification Algorithms
How to Spot-Check Classification Algorithms原创 2022-05-28 07:54:39 · 206 阅读 · 0 评论 -
How to understand Machine Learning Algorithm Performance Metrics
How to understand Machine Learning Algorithm Performance Metrics原创 2022-05-27 21:56:56 · 224 阅读 · 0 评论 -
How to Evaluate the Performance of Machine Learning Algorithms with Resampling
How to Evaluate the Performance of Machine Learning Algorithms with Resampling原创 2022-05-27 14:15:24 · 586 阅读 · 0 评论 -
How to Feature Selection For Machine Learning
How to Feature Selection For Machine Learning原创 2022-05-27 12:49:38 · 296 阅读 · 0 评论 -
How to Prepare Your Data For Machine Learning
How to Prepare Your Data For Machine Learning原创 2022-05-27 09:08:33 · 261 阅读 · 0 评论 -
How to Understand Your Data With Visualization
How to Understand Your Data With Visualization原创 2022-05-26 22:24:55 · 186 阅读 · 0 评论 -
How to Understand Your Data With Descriptive Statistics
How to Understand Your Data With Descriptive Statistics原创 2022-05-26 20:55:40 · 338 阅读 · 0 评论 -
How To Load Machine Learning Data
How To Load Machine Learning Data原创 2022-05-26 16:31:39 · 161 阅读 · 0 评论 -
About Crash Course in Python and SciPy
About Crash Course in Python and SciPy原创 2022-05-26 13:57:44 · 172 阅读 · 0 评论 -
Did you know about Python Ecosystem for Machine Learning
Did you know about Python Ecosystem for Machine Learning原创 2022-05-26 10:12:37 · 197 阅读 · 0 评论 -
如何利用SVD简化数据
如何利用SVD简化数据原创 2022-05-04 16:55:41 · 784 阅读 · 0 评论 -
如何利用PCA(Principal component analysis)来简化数据
本博文的的内容为以下:降维技术 主成分分析(PCA) 对半导体数据进行降维处理降维(dimensionality reduction)的目标就是对输入的数目进行消减,由此剔除数据中的噪声并提高机器学习方法的性能。本博文是涉及降维主题的两章中的第一章。在降维中,我们对数据进行了预处理。之后,采用 其他机器学习技术对其进行处理。本博文一开始对降维技术进行了综述,然后集中介绍一种应用非 常普遍的称为主成分分析的技术。最后,我们就通过一个数据集的例子来展示PCA的工作过程。 经过PCA处理之后,该数据原创 2022-05-04 09:57:44 · 1163 阅读 · 0 评论 -
Chapter 12 使用FP-growth算法来高效发现频繁项集
本博文内容包括以下:发现事务数据中的公共模式 FP-growth算法 发现twitter源中的共同词FP-growth 算法 是基于Apriori算法,但在完成相同的任务(将数据集存储在一个特定的称作FP树的结构之后发现频繁项集或频繁项对,即常在一块出现的元素项的集合FP树)时采用了一些不同的技术。这种算法的执行速度要快于Apriori,通常性能要好两个数量级以上。讨论从数据集中获取有趣信息的方法,最常用的两种分别是频繁项集与关联规则。FP-growth算法只需要对数据库进行两次扫描,而A原创 2022-05-03 21:47:37 · 2113 阅读 · 0 评论 -
CP11 Association analysis with the Apriori algorithm(使用Apriori算法进行关联分析)
本文章内容:Apriori算法 频繁项集生成 关联规则生成 投票中的关联规则发现忠诚度计划是指顾客使用会员卡可以获得一定的折扣,利用这种计划,商店可以了解顾客所购买的商品。关联关系(associate analysis)(关联规则学习association rule learning): 从大规模数据集中寻找物品间的隐含关系。本博文:首先讨论关联分析 然后讨论Apriori原理,Apriori算法正是基于该原理得到的。 接下来创建函数频繁项集高效发现的函数 然后从频繁集中抽取出原创 2022-05-03 04:22:01 · 399 阅读 · 0 评论 -
无监督学习-利用K-均值聚类算法对未标注数据分组(Grouping unlabeled items using k-means clustering)
k-means and its derivatives aren’t the only clustering algorithms. Another type ofclustering, known as hierarchical clustering, is also a widely used clustering algorithm.In the next chapter, we’ll examine the Apriori algorithm for finding association ru原创 2022-04-30 07:46:19 · 379 阅读 · 0 评论 -
深入走近 树回归 CART(Classification And Regression Trees)
本博文 包括以下内容:CART算法 回归与模型树 树剪枝算法 Python 中GUI 的使用问题: 实际生活中很多问题都是非线性的,不可能使用全局线性模型来拟合任何数据。解决方案:一种可行的方法是将数据集切分成很多份易建模的数据。然后利用第8章的线性回归技术来建模。如果首次切分后仍然难以拟合线性模型就继续切分。这种切分方式下,树结构和回归法相当有用。9.1 复杂数据的局部性建模9.2 连续和离散型特征的树的构建在树的构建过程中,需要解决多种类型数据的存储问题。we'r原创 2022-04-28 16:46:10 · 518 阅读 · 0 评论 -
Predicting numeric values: regression
This paper will covers:Linear regression Locally weighted linear regression(局部加权线性回归) Ridge regression and stagewise line regression(岭回归和逐步线性回归) Predicting the age of an abalone and an antique selling price(预测鲍鱼年龄和玩具售价)1.1 Finding best-fit lines with原创 2022-04-27 13:47:23 · 262 阅读 · 0 评论 -
利用AdaBoost元算法提高分类性能
利用AdaBoost元算法提高分类性能原创 2022-04-25 21:49:21 · 2785 阅读 · 0 评论 -
深入学习 Support vector machines(支持向量机SVM)
This arctile covers:Introducing support vector machines Using the SMO(sequential minimal optimization序列最小优化算法(英语:Sequential minimal optimization, SMO)是一种用于解决支持向量机训练过程中所产生优化问题的算法。目前被广泛使用于SVM的训练过程中,并在通行的SVM库LIBSVM中得到实现.) algorithm for optimization Usin..原创 2022-04-25 15:35:17 · 1654 阅读 · 0 评论 -
CP05 Logistic regression(Logistic 回归)
CP05 Logistic regression(Logistic 回归)原创 2022-04-19 21:46:26 · 560 阅读 · 0 评论 -
Classifying with probability theory Naive Bayes
This article covers:Using probability distributions for classification Learning the naive Bayes classifier Parsing data from RSS feeds Using naive Bayes to reveal regional attitudes4.1 Classifying with Bayesian decision theoryNaive BayesPros: Wor原创 2022-04-19 04:21:16 · 478 阅读 · 0 评论 -
Splitting datasets one feature at a time : decision trees
This article will be covers :Introducing decision trees Measuring consistency in a dataset Using recursion to construct a decision tree Plotting trees in MatplotlibThe decision tree is one of the most commonly used classification techniques;recent su原创 2022-04-15 21:32:37 · 662 阅读 · 0 评论 -
深入第一个机器学习算法: K-近邻算法(K-Nearest Neighbors)
本篇博文主要涉及到以下内容:K-近邻分类算法 从文本文件中解析和导入数据 使用Matplotlib创建扩散图 归一化数值K-近邻算法功能: 非常有效且易于掌握。学习K-近邻算法的思路:首先,探讨k-近邻算法的基本理论,以及如何使用距离测量的方法分类物品。 其次,使用Python 从文本文件中导入并解析数据。 再次,讨论当存在多种数据源时,如何避免计算距离时可能碰到的一些常见的错误。 最后,利用实际的例子讲解如何使用k-近邻算法改进约会网站和手写数字识别系统。1.K-近邻算法概原创 2022-04-14 10:53:29 · 2184 阅读 · 0 评论 -
机器学习的基本概念
数据挖掘十大算法 C4.5决策树 K-均值(K-mean) 支持向量机(SVM) Apriori 最大期望算法(EM)(涉及太多数学理论,此处不做详述) PageRank算法(Google充分论述过,此处不做详述) AdaBoot算法 k-近邻算法(KNN) 朴素贝叶斯算法(NB) 分类回归树(CART)算法原创 2022-04-11 21:57:15 · 1463 阅读 · 0 评论