
机器学习
文章平均质量分 65
Foneone
菜鸡养生记。
展开
-
详述差分进化算法(DE)代码复现
本文按照差分进化算法(DE)的步骤,详述了求解一个一元二次函数最小值的基本理论和代码,以实现差分进化算法全部过程。原创 2022-03-08 10:54:55 · 2680 阅读 · 0 评论 -
总结sklearn中常用的机器学习算法
监督学习算法随机森林(RF)随机森林算法,是bagging集成学习方式中的一种最具有特色的机器学习方法。它是以决策树为基本分类器,如果为分类问题,则最终采用投票法来决定类别;若为回归问题,则采用平均值的方法决定最终预测值。决策树算法带有剪枝过程,但RF算法没有此步骤。根据回归问题和分类问题,sklearn将RF算法分为:分类RF和回归RF。主要是依据样本特征而确定。可以直接利用RF进行多分类问...原创 2019-03-31 09:26:44 · 3817 阅读 · 0 评论 -
记录“归一化”方法
归一化(标准化):Z-score标准化方法;min-max标准化更为复杂的方法为【重新缩放法】,出自:http://www.nohup.cc/article/166/#menu_index_2【Z-score标准化方法】标准化方法有一个好处:python里面的numpy包中有求矩阵均值,标准差等统计参数的函数,很方便。其中,,,,分别表示原矩阵中需要归一化的输入数...原创 2018-10-18 19:50:32 · 290 阅读 · 0 评论 -
分类问题性能评价指标详述
目 录二分类问题代码实现多分类问题二分类问题根据样例和学习器预测类别的组合划分为表中四种情况,下图也叫做“混淆矩阵”。 真实情况 预测结果 正例 反例 正例 T...原创 2019-06-09 17:29:00 · 2212 阅读 · 2 评论 -
k_means手写代码的血和泪【辣鸡代码欢迎批评】
老师布置作业,要求这个代码,然后我就开始写了。用的是纸鸢花的数据集,为了体现聚类分析,我就把标签手动去掉了,又为了能够用三维图像装b,我就去掉了一维特征,留下了三维特征。补:在数据样本未知,且难易从数据分布等特征看出有明显分类的时候,K的选取尤为重要。一般K=3,4,5。在K=3,4,5时,去分别做聚类,验证效果。并且可以适当增加惩罚系数,增加容错性,有的样本本身就属于两个簇的交界地。...原创 2019-03-28 23:19:44 · 540 阅读 · 0 评论 -
sklearn.model_selection中的GridSearchCV(自适应模型库)
今天想要简单的应用一下,svr模型做一下支持向量机的回归,然后突然发现了这个宝贝函数。官网文档如下:https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.htmlclasssklearn.model_selection.GridSearchCV(estimator,...原创 2019-05-09 00:20:31 · 5470 阅读 · 0 评论 -
时间序列模型(ARIMA和ARMA)完整步骤详述
实现ARMA和ARIMA 时间序列模型的预测。原创 2019-05-28 14:57:27 · 190381 阅读 · 99 评论 -
sklearn.pipeline中的 Pipeline( 管道机制)
管道机制是按照封装顺序依次执行的一种机制,在机器学习算法中得以应用的根源在于,参数集在新数据集(比如测试集)上的重复使用。具体代码如下:from sklearn.pipeline import Pipeline #管道机制from sklearn.preprocessing import StandardScaler #标准化数据from sklearn import dataset...原创 2019-10-04 10:26:56 · 2481 阅读 · 0 评论