机器学习
文章平均质量分 92
White Root
也许回顾这一生,只是情感积累。无所谓做什么,只需告诉自己在路上。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
机器学习算法框架流程
Machine Learning and algorithm K Nearest NeighborGridSearchCValgorithm )K Nearest Neighborimport pandas as pdimport numpy as npfrom sklearn.neighbors import KNeighborsClassifier # classifierfrom sklearn.preprocessing import StandardScaler # standar原创 2020-07-05 21:05:04 · 726 阅读 · 2 评论 -
机器学习-算法总结图
机器学习-算法总结图加载数据&数据清洗特征工程数据分割模型训练线性模型线性回归逻辑回归非线性模型决策树集成学习无监督模型kmeans聚类拟合问题模型评估模型调优模型保存加载数据&数据清洗特征工程数据分割模型训练线性模型线性回归逻辑回归非线性模型决策树集成学习无监督模型kmeans聚类拟合问题模型评估模型调优模型保存...原创 2020-06-20 11:28:15 · 488 阅读 · 0 评论 -
机器学习-新闻分类案例
新闻分类案例项目,对文章进行分词,用TF-IDF和词袋,对文章进行分词,用TF-IDF和词袋表示文档特征,训练word2vec模型,完整过程,项目集成调用...原创 2020-06-05 21:08:37 · 1156 阅读 · 0 评论 -
科学计算库之pandas高级
这里写自定义目录标题时间序列处理合并分组&聚合透视表和交叉表透视表交叉表crosstab时间序列处理合并分组&聚合DataFrame.groupby(key, as_index=False)透视表和交叉表透视表透视表是一种可以对数据动态排布并且分类汇总的表格格式。而在pandas中它被称作pivot_table。pandas.pivot_table(data, values=None, index=None, columns=None,aggfunc=‘mean’, marg原创 2020-06-05 21:01:56 · 273 阅读 · 0 评论 -
科学计算库Pandas用法
科学计算库Pandas用法介绍数据结构SeriesDataFrameMultiIndex介绍以Numpy为基础,借力Numpy模块在计算方面性能高的优势,基于matplotlib,能够简便的画图,独特的数据结构。增强图表可读性便捷的数据处理能力读取文件方便封装了Matplotlib、Numpy的画图和计算数据结构Pandas中一共有三种数据结构,分别为:Series、DataFrame和MultiIndex(老版本中叫Panel )。Series是一维数据结构,DataFrame是二维原创 2020-06-05 21:02:35 · 308 阅读 · 0 评论 -
Matplotlib绘图和jupyter notebook使用
机器学习之科学计算库原创 2020-06-04 22:47:17 · 3178 阅读 · 1 评论 -
科学计算库Numpy用法
Numpynumpy介绍ndarray介绍N维数组-ndarrayndarray的形状基本操作ndarray运算数组间运算矩阵运算numpy介绍用于快速处理任意维度的数组。Numpy支持常见的数组和矩阵操作。对于同样的数值计算任务,使用Numpy比直接使用Python要简洁的多。Numpy使用ndarray对象来处理多维数组,该对象是一个快速而灵活的大数据容器。ndarray介绍NumPy提供了一个N维数组类型ndarray用来存储相同类型数据的集合ndarray的优势内存块风格原创 2020-06-04 22:46:41 · 339 阅读 · 0 评论 -
机器学习-逻辑回归
逻辑回归逻辑回归介绍逻辑回归的原理损失以及优化逻辑回归api介绍案例:癌症分类预测分类评估方法混淆矩阵精确率(Precision)与召回率(Recall)F1-score分类评估报告apiROC曲线与AUC指标TPR与FPRROC曲线AUC指标AUC计算APIROC曲线的绘制逻辑回归介绍应用场景:广告点击率、是否为垃圾邮件、是否患病、金融诈骗、虚假账号逻辑回归的原理输入激活函数损失以及优化逻辑回归的损失,称之为对数似然损失损失函数值,越小越好当y=1时,hθ (x)值越大越好;当原创 2020-06-05 21:04:13 · 309 阅读 · 0 评论 -
机器学习-决策树算法
决策树算法决策树算法简介决策树分类原理熵Entropy信息增益案例信息增益率案例基尼值和基尼指数案例总结常见决策树的启发函数比较其他cart剪枝常用剪枝方法特征工程-特征提取决策树算法简介决策树:是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果,本质是一颗由多个判断节点组成的树。决策树定义:是一种树形结构,本质是一颗由多个判断节点组成的树决策树分类原理熵Entropy物理学上,熵 Entropy 是“混乱”程度的量度。原创 2020-06-05 21:04:48 · 694 阅读 · 0 评论 -
机器学习-集成学习
集成学习算法集成学习集成学习中boosting和BaggingBaggingBagging集成原理随机森林构造过程随机森林api介绍随机森林预测案例Boostingboosting集成原理GBDT(了解)XGBoost【了解】集成学习集成学习通过建立几个模型来解决单一预测问题。工作原理是生成多个分类器/模型,各自独立地学习和作出预测。这些预测最后结合成组合预测,因此优于任何一个单分类的做出预测。集成学习中boosting和BaggingBaggingBagging集成原理随机森林构造过程随原创 2020-06-05 21:06:48 · 594 阅读 · 0 评论 -
机器学习-聚类算法
聚类算法、模型评估、算法优化、特征降维、kmeans/原创 2020-06-05 21:08:11 · 437 阅读 · 0 评论 -
机器学习-线性回归
线性回归线性回归线性回归线性回归(Linear regression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式。特点:只有一个自变量的情况称为单变量回归,多于一个自变量情况的叫做多元回归。from sklearn.linear_model import LinearRegression#获取数据x = [[80, 86],[82, 80],[85, 78],[90, 90],[86, 82],[82, 90],[78, 80原创 2020-06-05 21:07:26 · 2342 阅读 · 0 评论 -
机器学习-k近邻算法
机器学习-算法篇k近邻算法简介初步使用距离度量欧氏距离(Euclidean Distance)曼哈顿距离(Manhattan Distance)切比雪夫距离 (Chebyshev Distance)闵可夫斯基距离(Minkowski Distance)标准化欧氏距离 (Standardized EuclideanDistance)余弦距离(Cosine Distance)汉明距离(Hamming Distance)杰卡德距离(Jaccard Distance)马氏距离(Mahalanobis Distanc原创 2020-06-05 21:07:16 · 2191 阅读 · 0 评论
分享