machineLearning
文章平均质量分 76
不正经的蒙娜丽莎
天行健,君子以自强不息
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
深度学习中的上采样
上采样一些常见的方法有:近邻插值(nearest interpolation)、双线性插值(bilinear interpolation),双三次插值(Bicubic interpolation),反卷积(Transposed Convolution),反池化(Unpooling)。近邻插值最近邻插值法nearest_neighbor是最简单的灰度值插值。也称作零阶插值,就是令变换后像素的灰度值等于距它最近的输入像素的灰度值。最近邻插值法可应用于图像的缩放,因为简单的变换与计算,效果一般不好。举例说明其转载 2021-09-05 15:46:33 · 1169 阅读 · 0 评论 -
深度学习之卷积神经网络
目的:提取出图像中的关键信息(轮廓),再建立mlp模型进行训练图像卷积运算(convolution)对图像矩阵与滤波器矩阵进行对应相乘再求和运算,转化得到新的矩阵作用:将图片与轮廓滤波器进行卷积运算,可快速定位固定轮廓特征的位置A与B的卷积通常表示为:A*B或convolution(A,B)常用轮廓过滤器RGB图像的卷积:对RGB三个通道分别求卷积再相加卷积运算导致的两个问题:图像被压缩,造成信息丢失边缘信息使用少,容易被忽略解决方式:图像填充(padding)通过在图像各边增加像原创 2021-01-20 11:54:32 · 477 阅读 · 0 评论 -
机器学习之多层感知器
多层感知器(multi-Layer Perceptron)Keras是一个用Python编写的用于神经网络开发的应用接口,调用接口可以实现神经网络、卷积神经网络、循环神经网络等常用深度学习算法的开发特点:集成了深度学习中各类成熟的算法,容易安装和使用,样例丰富教程和文档也非常详细能够以TensorFlow,或者Theano作为后端运行https://keras.io/zh/https://keras.io/https://keras-cn.readthedocs.io/en/latest/#原创 2021-01-14 15:58:05 · 892 阅读 · 1 评论 -
机器学习之模型评估与优化
欠拟合和过拟合产生原因:模型不合适导致其无法对数据实现有效的预测。模型对数据的预测情况:训练数据预测数据欠拟合不准确不准确过拟合准确不准确好模型准确准确欠拟合可以通过观察训练数据及时发现,通过优化模型结果解决过拟合产生原因模型结构过于复杂(维度过高)使用了过多属性,模型训练时包含了干扰信息解决办法:简化模型结构(使用低阶模型,比如线性模型)数据预处理,保留主成分信息(数据PCA处理)在模型训练时,增加正则化项(regulariza原创 2020-10-30 18:47:23 · 1397 阅读 · 1 评论 -
机器学习之主成分分析
数据降维数据降维(Dimensionality Reduction):是指在某些限定条件下,降低随机变量个数,得到一组不相关主变量的工程.其目的:减少模型分析数据量,提升处理效率,降低计算难度;实现数据可视化数据降维的实现:主成分分析(PCA)PCA(principal components analysis):数据降维技术中。应用最最多的方法目标:寻找k (k < n) 维新数据,使它们反映事物的主要特征核心:在信息损失尽可能少的情况下,降低数据维度。信息损失衡量标准为,原有点到原创 2020-10-25 15:39:32 · 314 阅读 · 0 评论 -
机器学习之异常检测
异常检测异常检测(Anomaly Detection):根据输入数据,对不符合预期模式的数据进行识别概率密度概率密度:描述随机变量在某个确定的取值点附近的可能性的函数计算数据均值µ,标准差σ计算对应的高斯分布概率函数根据数据点概率,进行判断,如果p(x) < ε;该点为异常点当数据维度高于一维时:同理,根据数据点概率,进行判断,如果p(x) < ε;该点为异常点代码实现#数据分布统计plt.hist(x1,bins = 100)#计算数据均值、标准差x1_mea原创 2020-10-24 16:03:25 · 422 阅读 · 0 评论 -
机器学习之决策树
决策树的定义决策树:一种对实例进行分类的树形结构,通过多层判断区分目标所属类别本质:通过多层判断,从训练数据集中归纳出一组分类规则优点:计算量小,运算速度快易于理解,可清晰查看各属性的重要性缺点:忽略属性间的相关性样本类别分布不均匀时,容易影响模型表现信息熵信息熵(entropy):是度量随机变量不确定性地指标,熵越大,变量地不确定性就越大。假定当前样本集合D中第k类样本所占的比例为pk,则D的信息熵为:目标:划分后样本分布不确定性尽可能小,即划分后信息熵小,信息增益大决原创 2020-10-19 15:50:00 · 208 阅读 · 0 评论 -
机器学习之聚类分析
聚类监督学习:线性回归 逻辑回归 KNN(这里引入KNN是为了与Kmeans进行区分)非监督学习:聚类 (Kmeans Mean-shit)无监督学习(unsupervised learning)无监督学习:机器学习的一种方法,没有给定事先标记过的训练实例,自动对输入的数据进行分类或分群优点:算法不受监督信息(偏见)的约束,可能考虑到新的信息不需要标签,极大程度扩大数据样本主要应用: 聚类分析、关联规则、维度缩减聚类分析(clustering):聚类分析又称为群分析,根据对象某些属性的原创 2020-10-16 16:06:37 · 1915 阅读 · 0 评论 -
机器学习之逻辑回归分析
Classification(分类问题)分类:根据已知样本的某些特征,判断一个新的样本属于哪种已知的样本类基本框架y = f(x1,x2…xn) 判断为类别N,如果y = n分类方法 逻辑回归 KNN紧邻模型 决策树 神经网络分类任务与回归任务的明显区别分类任务分原创 2020-10-09 23:08:42 · 502 阅读 · 1 评论 -
机器学习之LR实现线性预测
线性回归预测房价任务:基于usa_housing_price.csv数据,建立线性回归模型,预测合理房价以sqft_living为输入变量,建立单因子模型,评估模型表现,可视化线性回归预测结果以sqft_living、sqft_lot、sqft_above、yr_built、lat为输入变量,建立多因子模型,评估模型表现预测sqft_living=1180、sqft_lot=5650、sqft_above=1180、yr_built=1955、lat=47.5112的合理房价# load t原创 2020-10-03 15:57:12 · 1557 阅读 · 1 评论 -
Scikit-learn介绍与安装
Scikit-learnPython语言中专门针对机器学习应用而发展起来的一款开源框架(算法库),可以实现数据预处理、分类、回归、降维、模型选择等常用的机器学习算法特点集成了机器学习中各类成熟的算法,容易安装和使用,样例丰富,教程和文档也非常详细不支持Python之外的语言,不支持深度学习和强化学习调用Sklearn求解线性回归问题# 寻找a、b(y = ax + b)from sklearn.linear_model import LinearRegressionlr_model =原创 2020-10-02 15:53:38 · 566 阅读 · 0 评论 -
机器学习初识概念
机器学习是关于在计算机上从数据中产生模型(mode)的算法,即学习算法(learning algorithm)学得模型对应了关于数据的某种潜在的规律,因此亦称为假设(hypothesis);这种潜在规律自身,则成为真相或真实(ground-truth);模型也可称为学习器(learner)标记(label)是输出结果信息,所有标记的集合为标记空间或输出空间(label space);若我们预测值是离散的,称为分类(classification);若预测值是连续值,则称此类学习任务为回归(regressi原创 2020-09-26 17:22:25 · 249 阅读 · 0 评论
分享