
机器学习
文章平均质量分 62
Mr Robot
When I’m old and dying, I plan to look back on my life and say “wow, that was an adventure,” not “wow, I sure felt safe.”
山东南海岸程序猿,美国《时代周刊》2006年度风云人物;
《感动中国》2008年度人物;
联合国2019年度“地球卫士奖”
国际奥委会2022年”奥林匹克奖杯“获奖者
展开
-
智能健康监测床垫算法实现---基于EMD算法采集心跳和呼吸心率分离(附详细源代码)适用于PVDF传感器和其他压阻人体体征传感器
智能健康监测床垫整体实现床垫式生理信号监测系统的框图见图 1,薄垫中安装 PVDF压电传感器, 可以捕捉人体呼吸和心跳的微弱振动信号, 输出相应的电荷信号。电荷放大器对传感器的输出信号进行放大, 并转化为电压信号。低通滤波器用于滤除工频干扰和高频噪声。考虑到不同个体的生理信号强度不同, 在电路上增加可以自动调节增益的电压放大器, 使得输出信号的幅度在合适的范围。MCU (microcontroller unit)对模拟前端的输出信号进行处理和分析, 得到呼吸率和心率的计算结果。 床垫实...原创 2021-06-18 09:28:23 · 6474 阅读 · 5 评论 -
Adaboost API algorithm参数取值比较实战
项目工程和数据集我上传了集成学习:随机森林、GBDT、XGBoost实战代码合集from sklearn.externals.six.moves import zipimport matplotlib.pyplot as pltimport matplotlib as mplfrom sklearn.datasets import make_gaussian_quantilesfrom sklearn.ensemble import AdaBoostClassifierfrom sklear原创 2021-07-29 10:26:37 · 291 阅读 · 0 评论 -
Adaboost分类算法实战
项目工程和数据集我上传了Adaboost分类算法import numpy as npimport matplotlib.pyplot as pltimport matplotlib as mplfrom sklearn.ensemble import AdaBoostClassifier#adaboost引入方法from sklearn.tree import DecisionTreeClassifierfrom sklearn.datasets import make_gaussian_qu原创 2021-07-29 10:20:01 · 386 阅读 · 1 评论 -
随机森林宫颈癌预测实战
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport matplotlib as mplfrom sklearn import treefrom sklearn.ensemble import RandomForestClassifierfrom sklearn.model_selection import train_test_splitfrom sklearn.pipeline import P原创 2021-07-29 10:15:43 · 1104 阅读 · 1 评论 -
Bagging&Boosting算法实战回归模型
import numpy as npimport matplotlib as mplimport matplotlib.pyplot as pltimport pandas as pdimport warningsimport sklearnfrom sklearn.linear_model import LinearRegression, LassoCV, Ridge, ElasticNetCVfrom sklearn.preprocessing import PolynomialFeatu原创 2021-07-29 09:52:44 · 962 阅读 · 1 评论 -
机器学习算法之集成学习:随机森林、GBDT、XGBoost(下)
梯度提升迭代决策树GBDTGBDT也是Boosting算法的一种,但是和AdaBoost算法不同;区别如下:AdaBoost算法是利用前一轮的弱学习器的误差来更新样本权重值,然后一轮一轮的迭代;GBDT也是迭代,但是GBDT要求弱学习器必须是CART模型,而且GBDT在模型训练的时候,是要求模型预测的样本损失尽可能的小。别名:GBT(Gradient Boosting Tree)、GTB(Gradient Tree Boosting)、GBRT(Gradient Boosting Regression原创 2021-07-29 09:41:32 · 942 阅读 · 1 评论 -
机器学习算法之集成学习:随机森林、GBDT、XGBoost(中)
RF scikit-learn相关参数随机森林的思考在随机森林的构建过程中,由于各棵树之间是没有关系的,相对独立的;在构建的过程中,构建第m棵子树的时候,不会考虑前面的m-1棵树。思考:如果在构建第m棵子树的时候,考虑到前m-1棵子树的结果,会不会对最终结果产生有益的影响?各个决策树组成随机森林后,在形成最终结果的时候能不能给定一种既定的决策顺序呢?(也就是那颗子树先进行决策、那颗子树后进行决策)Boosting提升学习(Boosting)是一种机器学习技术,可以用于回归和分类的问题,它每原创 2021-07-28 17:37:15 · 501 阅读 · 0 评论 -
机器学习算法之集成学习:随机森林、GBDT、XGBoost(上)
随机森林提升算法GBDT(迭代决策树)Adaboost集成学习(Ensemble Learning)集成学习的思想是将若干个学习器(分类器&回归器)组合之后产生一个新学习器。弱分类器(weak learner)指那些分类准确率只稍微好于随机猜测的分类器(errorrate < 0.5);集成算法的成功在于保证弱分类器的多样性(Diversity)。而且集成不稳定的算法也能够得到一个比较明显的性能提升。常见的集成学习思想有:BaggingBoostingStacking原创 2021-07-28 17:12:11 · 1223 阅读 · 0 评论 -
EM无监督算法分类鸢尾花数据实战
使用EM算法对鸢尾花数据进行分类操作数据和工程代码import numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.colorsimport matplotlib.pyplot as pltfrom sklearn.mixture import GaussianMixturefrom sklearn.metrics.pairwise import pairwise_distances_argmin原创 2021-07-26 18:03:59 · 1038 阅读 · 1 评论 -
GMM的不同参数实战
import numpy as npimport pandas as pdimport itertoolsfrom scipy import linalgimport matplotlib as mplimport matplotlib.colorsimport matplotlib.pyplot as pltfrom sklearn.mixture import GaussianMixturefrom sklearn.model_selection import train_test_.原创 2021-07-26 17:57:41 · 598 阅读 · 0 评论 -
GMM算法分类及参数选择案例实战
代码和数据下载地址import numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.colorsimport matplotlib.pyplot as pltfrom sklearn.mixture import GaussianMixturefrom sklearn.model_selection import train_test_split# 解决中文显示问题mpl.rcParams['f原创 2021-07-26 17:53:28 · 1740 阅读 · 0 评论 -
EM分类初识及GMM算法实现
import numpy as npimport matplotlib as mplimport matplotlib.pyplot as pltfrom mpl_toolkits.mplot3d import Axes3D# 多元正态分布# multivariate_normal API参考链接:https://docs.scipy.org/doc/numpy-dev/genindex.html# multivariate_normal API参考链接:http://scipy.github.原创 2021-07-26 17:47:28 · 473 阅读 · 0 评论 -
机器学习算法之EM算法(下)
我真的想让这个世界变得更好,但是他们不给我源代码……GMM-EM算法求解 对均值求偏导GMM-EM算法求解 对概率使用拉格朗日乘子法求解下节将介绍EM分类的栗子案例一:EM分类初识原创 2021-07-26 17:34:53 · 108 阅读 · 0 评论 -
机器学习算法之EM算法(中)
当年刚学打篮球的时候,疯狂地迷恋上了乔丹,然后迷恋上了NIKE,更熟记了NIKE的那句广告语:JUST DO IT。 然后…我从此进入了IT行业。言归正传:介绍一下Jensen不等式EM算法直观案例...原创 2021-07-26 17:26:45 · 154 阅读 · 0 评论 -
机器学习算法之EM算法(上)
“你们用盗版的时候有想过做出这款软件的程序员吗?他们该如何养家糊口?”“哈哈哈,别逗了,程序员哪有家要养啊!最大似然估计(MLE)回顾Maximum Likelihood EstimationMLE就是利用已知的样本结果,反推最有可能(最大概率)导致这样结果的参数值的计算过程。直白来讲,就是给定了一定的数据,假定知道数据是从某种分布中随机抽取出来的,但是不知道这个分布具体的参数值,即“模型已定,参数未知”,MLE就可以用来估计模型的参数。MLE的目标是找出一组参数(模型中的参数),使得模型原创 2021-07-26 17:18:36 · 246 阅读 · 0 评论 -
机器学习算法之决策树分类模型可视化
程序猿跟产品经理一起看电视。每个节目看到一半程序猿就换台,看到一半就换台,几次之后产品经理终于忍无可忍的咆哮:老子刚看出点意思你就换、刚看出点意思你就换,到底还让不让人看啦?!程序猿淡定的盯着电视道:你半路改需求的时候我可没吱过声!程序员的鄙视链是什么?老婆漂亮的程序员,鄙视老婆不漂亮的程序员。有老婆的程序员,鄙视没有老婆的程序员。没有老婆有女朋友的程序员,鄙视单身程序狗。在单身狗之间,才有语言、编辑器和操作系统的互相鄙视。单身狗的快乐,就在于破坏别人浪漫的约会,开心import numpy原创 2021-07-24 14:58:39 · 710 阅读 · 0 评论 -
机器学习算法之决策树回归模型可视化
一个程序员在海滨游泳时溺水身亡。他死前拼命的呼救,当时海滩上有许多救生员,但是没有人救他。因为他一直大喊“F1!”“F1!”,谁都不知道“F1”究竟是什么意思。分类树和回归树的区别import numpy as npimport matplotlib as mplimport matplotlib.pyplot as pltimport pandas as pdimport warningsimport sklearnfrom sklearn.linear_model import原创 2021-07-24 14:43:53 · 2014 阅读 · 1 评论 -
机器学习算法之决策树(下)决策树优化策略
某晚上同学生日去唱KTV,他公司的一个美女工程师非要和我拼酒。她说如果她输了可以答应我一件事,而我输了同样也要答应她一件事。结果我不出意外地赢了,于是迫不及待地带着她回家…嘿嘿嘿…到家后,我看着她水汪汪的大眼睛,十分深情地说:”麻烦你帮我coding,顺便帮我debug。“之后我一个人躲在被窝里暗暗地称赞自己真的太特么机智了!决策树优化策略剪枝优化决策树过渡拟合一般情况是由于节点太多导致的,剪枝优化对决策树的正确率影响是比较大的,也是最常用的一种优化方式。Random Forest利用训练原创 2021-07-24 14:36:23 · 3073 阅读 · 0 评论 -
机器学习算法之决策树过拟合和欠拟合
程序员的读书历程:x语言入门 —> x语言应用实践 —> x语言高阶编程 —> x语言的科学与艺术 —>编程之美 —>编程之道 —>编程之禅—>颈椎病康复指南。import numpy as npfrom sklearn.tree import DecisionTreeRegressorimport matplotlib.pyplot as plt# 产生一个随机数rng = np.random.RandomState(1)X = np.sort(1原创 2021-07-24 14:29:14 · 694 阅读 · 0 评论 -
机器学习算法之决策树实现波士顿房屋租赁价格预测
搞IT太辛苦了,想换一行怎么办?”“敲一下Enter键。”import numpy as npimport matplotlib as mplimport matplotlib.pyplot as pltimport pandas as pdimport warningsimport sklearnfrom sklearn.linear_model import LinearRegression, LassoCV, RidgeCVfrom sklearn.pipeline import P原创 2021-07-24 14:24:01 · 1131 阅读 · 2 评论 -
机器学习算法之决策树实现鸢尾花数据特征属性比较
某程序员退休后决定练习书法,于是重金购买文房四宝。一日,饭后突生雅兴,一番研墨拟纸,并点上上好檀香。定神片刻,泼墨挥毫,郑重地写下一行字:hello world!import numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as pltfrom sklearn.tree import DecisionTreeClassifiermpl.rcParams['font.sans-seri原创 2021-07-24 14:14:42 · 456 阅读 · 2 评论 -
机器学习算法之决策树实现鸢尾花数据分类
**决策树案例:鸢尾花数据分类**import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport matplotlib as mplimport warningsfrom sklearn import tree #决策树from sklearn.tree import DecisionTreeClassifier #分类树from sklearn.model_selection import原创 2021-07-24 14:08:01 · 6818 阅读 · 1 评论 -
机器学习算法之决策树(中)
下边说一下决策树生成算法建立决策树的主要是以下三种算法ID3C4.5CART(Classification And Regression Tree)ID3算法ID3算法优缺点C4.5算法CART算法ID3、C4.5、CART分类树算法总结原创 2021-07-24 13:54:39 · 98 阅读 · 0 评论 -
机器学习算法之决策树(上)
信息熵决策树决策树优化剪枝决策树可视化决策树直观理解比特化(Bits)原创 2021-07-24 13:43:01 · 205 阅读 · 0 评论 -
机器学习算法之聚类算法拓展:K-Means和Mini Batch K-Means算法效果评估
聚类算法的衡量指标混淆矩阵均一性完整性V-measure调整兰德系数(ARI)调整互信息(AMI)轮廓系数(Silhouette)import timeimport numpy as np import matplotlib.pyplot as plt import matplotlib as mplfrom sklearn.cluster import MiniBatchKMeans, KMeans from sklearn import metricsf...原创 2021-07-19 15:37:08 · 1037 阅读 · 1 评论 -
机器学习算法之聚类算法拓展:Mini Batch K-Means算法
言归正传,先介绍一下 Mini Batch K-Means算法Mini Batch K-Means算法是K-Means算法的一种优化变种,采用小规模的数据子集(每次训练使用的数据集是在训练算法的时候随机抽取的数据子集)减少计算时间,同时试图优化目标函数;Mini Batch K-Means算法可以减少K-Means算法的收敛时间,而且产生的结果效果只是略差于标准K-Means算法算法步骤如下:首先抽取部分数据集,使用K-Means算法构建出K个聚簇点的模型继续抽取训练数据集中的部分数据集样..原创 2021-07-19 14:40:49 · 4541 阅读 · 1 评论 -
机器学习算法之聚类算法
同学给我发个文件, 结果我半天都没有收到 我问他怎么回事?他很无奈,说:“Word很大,你忍一下”言归正传,介绍一下本篇文章的主要内容:Jaccard相似度、Pearson相似度K-means聚类聚类算法效果评估(准确率、召回率等)层次聚类算法密度聚类算法谱聚类算法什么是聚类聚类就是对大量未知标注的数据集,按照数据内部存在的数据特征将数据集划分为多个不同的类别,使类别内的数据比较相似,类别之间的数据相似度比较小;属于无监督学习聚类算法的重点是计算样本项之间的相似度,有时候也称为样本间的原创 2021-07-19 14:15:40 · 595 阅读 · 1 评论 -
人工智能数学基础之数据分析
1669年,牛顿在剑桥大学升为数学教授。当时学校资金紧张,包括牛顿大部分教职工薪水已欠数月。为解决此问题,牛顿潜心研究创立了微积分,将一门名叫“高等数学”的新科目设为全校的必修课,并规定不及格者来年必须缴费重修直到通过。很快教师们的工资发了下来。...原创 2021-07-13 17:56:48 · 346 阅读 · 0 评论 -
机器学习算法之贝叶斯算法 3、案例二:新闻数据分类
import numpy as npfrom time import timeimport matplotlib.pyplot as pltimport matplotlib as mplfrom sklearn.datasets import fetch_20newsgroups#引入新闻数据包from sklearn.feature_extraction.text import TfidfVectorizer#做tfidf编码from sklearn.feature_selection i原创 2021-07-14 11:16:15 · 879 阅读 · 2 评论 -
机器学习算法之隐马尔可夫算法 1、理论
首先说一下什么是马尔科夫过程:原创 2021-07-15 13:18:50 · 138 阅读 · 1 评论 -
机器学习算法之贝叶斯算法 1、理论
链接: 贝叶斯算法栗子代码.原创 2021-07-14 10:58:06 · 125 阅读 · 0 评论 -
机器学习算法之KNN 1、理论
近邻分类思想KNN(k-Nearest Neighbor)分类算法是数据挖掘分类技术中较简单的方法之一。所谓k最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。例如,上图中,绿色圆要被决定赋予哪个类,是红色三角形还是蓝色四方形?如果K=3,由于红色三角形所占比例为2/3,绿色圆将被赋予红色三角形那个类,如果K=5,由于蓝色四方形比例为3/5,因此绿色圆被赋予蓝色四方形类。举个栗子:KNN参数介绍:...原创 2021-07-14 09:55:22 · 172 阅读 · 1 评论 -
机器学习分类算法比较
昨天晚上下班回家,一民警迎面巡逻而来。突然对我大喊:站住!民警:int 类型占几个字节?我:4 个。民警:你可以走了。我感到很诧异。我:为什么问这样的问题?民警:深夜还在街上走,寒酸苦逼的样子,不是小偷就是程序员。工程代码完整已上传:不同SVM核函数效果比较import numpy as npimport matplotlib.pyplot as pltimport matplotlib as mplfrom matplotlib.colors import ListedColorm原创 2021-07-17 12:19:31 · 221 阅读 · 2 评论 -
使用SVM预测波士顿房价
手机问题,其他行业的人,以为程序员们,什么都会,程序员中,女程序员以为男程序员,什么都会,男程序员中,一般程序员以为技术好的程序员,什么都会,技术好的程序员,每次都在网上苦苦找答案。。。。。。工程代码完整已上传:使用SVM预测波士顿房价import numpy as npimport matplotlib as mplimport matplotlib.pyplot as pltimport pandas as pdimport warningsimport sklearnfrom原创 2021-07-17 12:06:39 · 5314 阅读 · 4 评论 -
自定义SVM内部核函数
“神舟十一号,地面信号异常,现在请汇报您的具体位置?”“现在我们正在祖国上空”“你们怎么知道的?”“刚才试验了一下,Twitter和FaceBook都打不开。”工程代码完整已上传:自定义SVM内部核函数import numpy as npimport matplotlib as mplimport matplotlib.pyplot as pltfrom sklearn import svm, datasets## 设置属性防止中文乱码mpl.rcParams['font.sans-se原创 2021-07-17 11:59:10 · 1068 阅读 · 0 评论 -
使用SVM对手写数字的识别
今晚加班到快通宵了,困得快睁不开眼了,女上司很关心,问我要不要吃宵夜。我没好气地说,宵夜就算了,能让我睡一觉就行了。女上司红着脸说了句讨厌啊,然后坐在我身边不动,好像距离我很近,搞得我很紧张,难道她发现我的程序出了bug?import matplotlib as mplimport matplotlib.pyplot as pltfrom sklearn import datasets, svm, metrics## 设置属性防止中文乱码mpl.rcParams['font.sans-ser原创 2021-07-17 11:30:09 · 1035 阅读 · 1 评论 -
SVM多目标属性分类问题
import timeimport numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as pltfrom sklearn.datasets import make_multilabel_classificationfrom sklearn.multiclass import OneVsRestClassifierfrom sklearn.svm import SVCfrom sk.原创 2021-07-17 11:23:34 · 583 阅读 · 1 评论 -
机器学习算法之鸢尾花数据SVM分类
import numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as pltimport warningsfrom sklearn import svm #svm导入from sklearn.model_selection import train_test_splitfrom sklearn.metrics import accuracy_scorefrom sklearn.exc.原创 2021-07-16 16:09:06 · 4612 阅读 · 0 评论 -
机器学习算法之不同SVM惩罚参数C值不同效果比较
相亲的程序员太苦逼了言归正传:来看看使用SVM惩罚参数C值效果对比svm1 = SVC(C=0.1,kernel=‘rbf’)svm2 = SVC(C=1,kernel=‘rbf’)svm3 = SVC(C=10,kernel=‘rbf’)svm4 = SVC(C=100,kernel=‘rbf’)svm5 = SVC(C=500,kernel=‘rbf’)svm6 = SVC(C=100000,kernel=‘rbf’)以下是具体代码:import timeimport原创 2021-07-17 10:51:55 · 3218 阅读 · 0 评论 -
机器学习算法之不同SVM核函数效果比较
工程代码完整已上传:不同SVM核函数效果比较如图所示的两类数据,分别分布为两个圆圈的形状,这样的数据本身就是线性不可分的,此时咱们该如何把这两类数据分开呢?由我们的经验可以得到,一个理想的分界应该是一个“圆圈”而不是一条线(超平面) 。如果用 X1 和 X2 来表示这个二维平面的两个坐标的话, 我们知道一条二次曲线(圆圈是二次曲线的一种特殊情况)的方程可以写作这样的形式:import timeimport numpy as npimport pandas as pdimpo原创 2021-07-17 10:31:12 · 2438 阅读 · 1 评论