
机器学习
a useful man
希望做一个有用的人。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python做多元线性回归
下表列出了中国某年按行业分的全部制造业国有企业及规模以上制造业非国有企业的工业总产值Y,资产合计K及职工人数L。(l)利用上述资料,进行回归分析。(2)回答:中国该年的制造业总体呈现规模报酬不变状态吗?发到我邮箱chendh@dlut.edu.cn格式:第一次上机实验+姓名+学号。发送内容:包括结论和stata工作文件(其它软件格式也行)。时间:本周周六上课之前。*****作答将...原创 2020-03-30 11:41:40 · 5064 阅读 · 0 评论 -
几个网址
https://blog.youkuaiyun.com/meteor_93/article/details/103676762?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-taskhttps://www.geekdigging.com/category/p...原创 2020-03-24 13:18:17 · 287 阅读 · 0 评论 -
用excel做机器学习
你知道Excel可以做人工智能、机器学习吗?比如下面的Excel文档,通过神经网络算法,可以让Excel识别出象素图中的人是谁!(Elon Musk)小伙伴们想不想学呢?我们在以后的节目中会为大家介绍如何实现!今天,我们从基础开始,学习如何通过 Microsoft Azure Machine Learning (微软机器学习,以下简称ML) 的网络服务, 把一些机器学习的模型嫁接到Exce...原创 2020-03-18 02:44:02 · 3178 阅读 · 0 评论 -
贝叶斯网络/深度信念网络学习
贝叶斯网络结构学习之K2算法(基于FullBNT-1.0.4的MATLAB实现)贝叶斯网络结构学习之MCMC算法(基于FullBNT-1.0.4的MATLAB实现)贝叶斯网络参数学习(基于FullBNT-1.0.4的MATLAB实现)贝叶斯网络结构学习(基于BDAGL工具箱的MATLAB实现)...原创 2020-03-15 18:46:37 · 927 阅读 · 0 评论 -
贝叶斯网络
Please consider citing the JMLR-MLOSS Manuscript if you’ve used pomegranate in your academic work!pomegranate is a package for building probabilistic models in Python that is implemented in Cython fo...原创 2020-03-15 17:34:18 · 322 阅读 · 0 评论 -
非平衡数据处理方式与评估
解决这一问题的基本思路是让正负样本在训练过程中拥有相同的话语权,比如利用采样与加权等方法。为了方便起见,我们把数据集中样本较多的那一类称为“大众类”,样本较少的那一类称为“小众类”。解决方式分为:一、相关方法总结1、采样采样方法是通过对训练集进行处理使其从不平衡的数据集变成平衡的数据集,在大部分情况下会对最终的结果带来提升。采样分为上采样(Oversampling,过采样)和下采样(U...原创 2020-01-31 17:00:10 · 987 阅读 · 0 评论 -
用于特征选择的F-Score打分及其Python实现
F-Score(非模型评价打分,区别与 F1_score )是一种衡量特征在两类之间分辨能力的方法,通过此方法可以实现最有效的特征选择。最初是由台湾国立大学的Yi-Wei Chen提出的(参考《Combining SVMs with Various Feature Selection Strategies》),公式如下:其中i代表第i个特征,即每一个特征都会有一个F-score。x拔是所有该特...原创 2020-01-02 01:10:57 · 12524 阅读 · 17 评论 -
数学符号及其含义
https://blog.youkuaiyun.com/qq_37212752/article/details/83956265https://blog.youkuaiyun.com/weixin_33883178/article/details/85473748https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=1&rsv_idx=1&tn=bai...原创 2019-12-24 16:38:27 · 999 阅读 · 0 评论 -
模型评估
机器学习模型评估指标汇总机器学习之模型评估Python机器学习笔记:常用评估模型指标的用法原创 2019-11-26 14:12:13 · 151 阅读 · 0 评论 -
好文章
使用sklearn优雅地进行数据挖掘使用sklearn做单机特征工程使用Python进行描述性统计机器学习中,有哪些特征选择的工程方法?原创 2019-11-25 15:01:51 · 135 阅读 · 0 评论 -
OneHotEncoder独热编码和 LabelEncoder标签编码——机器学习
学习sklearn和kagggle时遇到的问题,什么是独热编码?为什么要用独热编码?什么情况下可以用独热编码?以及和其他几种编码方式的区别。首先了解机器学习中的特征类别:连续型特征和离散型特征拿到获取的原始特征,必须对每一特征分别进行归一化,比如,特征A的取值范围是[-1000,1000],特征B的取值范围是[-1,1].如果使用logistic回归,w1x1+w2x2,因为x1的取值太大了,...原创 2019-11-25 13:33:40 · 362 阅读 · 0 评论 -
XGBoost、LightGBM的详细对比介绍
https://www.cnblogs.com/infaraway/p/7890558.html转载 2019-11-23 03:27:19 · 145 阅读 · 0 评论 -
Type I and type II errors | 第一类错误和第二类错误
https://blog.youkuaiyun.com/weixin_34226182/article/details/86400139https://blog.youkuaiyun.com/akon_wang_hkbu/article/details/77776486https://blog.youkuaiyun.com/dgyuanshaofeng/article/details/78686117https://blog....原创 2019-11-23 01:22:49 · 1542 阅读 · 0 评论 -
回归评价指标MSE、RMSE、MAE、R-Squared
前言分类问题的评价指标是准确率,那么回归算法的评价指标就是MSE,RMSE,MAE、R-Squared。下面一一介绍均方误差(MSE)MSE (Mean Squared Error)叫做均方误差。看公式这里的y是测试集上的。用 真实值-预测值 然后平方之后求和平均。猛着看一下这个公式是不是觉得眼熟,这不就是线性回归的损失函数嘛!!! 对,在线性回归的时候我们的目的就是让这个损失函数最小...原创 2019-11-23 00:31:16 · 1408 阅读 · 0 评论 -
热力图和相关系数分析
数据分析在机器学习中非常重要,它决定后续的特征值选取和数据处理的方向。热力图(heatmap)和相关性(correlation)分析则是常见的分析手段,本文主要介绍两者的使用方法,文中使用的演示代码放在GitHub中。热力度热力度常常用来表示地图上的分布密度,也可以简单理解为两维坐标中的数值到颜色的映射图。我们来看下面的热力度,去掉方格中颜色后,其实就是一个二维矩阵皮尔森相关系数相关性最...原创 2019-11-23 00:02:39 · 38862 阅读 · 1 评论 -
代价敏感的学习方法
代价敏感的学习方法是机器学习领域中的一种新方法,它主要考虑在分类中,当不同的分类错误会导致不同的惩罚力度时如何训练分类器。例如在医疗中,“将病人误诊为健康人的代价”与“将健康人误诊为病人的代价”不同;在金融信用卡盗用检测中,“将盗用误认为正常使用的代价”与将“正常使用误认为盗用的代价”也不同。通常,不同的代价被表示成为一个N×N的矩阵Cost中,其中N 是类别的个数。Cost[i, j]表示将一个...原创 2019-11-22 23:55:16 · 11372 阅读 · 1 评论 -
probit概率单位回归分析
SPSS学习笔记9:probit概率单位回归分析http://www.datasoldier.net/archives/614http://www.sohu.com/a/256543537_655370statahttps://blog.youkuaiyun.com/arlionn/article/details/84943212原创 2019-11-22 13:05:12 · 3669 阅读 · 0 评论 -
逻辑数据库
https://www.cnblogs.com/sap-ronny/articles/8461823.html原创 2019-11-20 16:04:12 · 442 阅读 · 0 评论 -
机器学习
https://blog.youkuaiyun.com/CoderPai/article/details/78807606原创 2019-11-20 15:45:00 · 124 阅读 · 0 评论 -
有这一篇机器学习全够了
https://blog.youkuaiyun.com/np4rHI455vg29y2/article/details/79549560https://www.douban.com/note/722184475/?type=likehttps://www.cnblogs.com/baby-lily/p/10680617.htmlhttps://www.cnblogs.com/LBSer/p/460590...原创 2019-11-20 15:43:36 · 138 阅读 · 0 评论 -
深度学习
https://www.youkuaiyun.com/gather_28/MtTaggysNjM2OC1ibG9n.html原创 2019-11-18 12:46:51 · 140 阅读 · 0 评论 -
遗传算法
根据提取的特征个数确定遗传算法中个体的长度,然后随机产生二进制种群,1代表有这个特征,0代表没有这个特征,然后根据这些特征进行svm训练与测试,用svm的分类精度作为适应度值,然后进行迭代,直到达到最大迭代次数,输出最优的分类精度和其对应的染色体,染色体中为1 的位置就是我们所要选择的特征。https://www.zhihu.com/question/23293449https://www.j...原创 2019-11-17 19:18:05 · 324 阅读 · 0 评论 -
集成学习
一、集成学习法在机器学习的有监督学习算法中,我们的目标是学习出一个稳定的且在各个方面表现都较好的模型,但实际情况往往不这么理想,有时我们只能得到多个有偏好的模型(弱监督模型,在某些方面表现的比较好)。集成学习就是组合这里的多个弱监督模型以期得到一个更好更全面的强监督模型,集成学习潜在的思想是即便某一个弱分类器得到了错误的预测,其他的弱分类器也可以将错误纠正回来。集成方法是将几种机器学习技术组合...原创 2019-11-17 15:23:52 · 275 阅读 · 0 评论 -
191115-2
smote:https://blog.youkuaiyun.com/march_on/article/details/48650237特征工程代码模板:http://www.shataowei.com/2017/12/01/python%E5%BC%80%E5%8F%91%EF%BC%9A%E7%89%B9%E5%BE%81%E5%B7%A5%E7%A8%8B%E4%BB%A3%E7%A0%81%E6%...原创 2019-11-15 22:08:44 · 201 阅读 · 0 评论 -
如何免费使用数据挖掘软件RapidMiner - 申请学生许可证
如果你是一名在校学生,有校园邮箱,是可以免费使用RapidMiner的全部功能的,方法如下:-首先登录官网 https://rapidminer.com,注册账户,Account Type 需要选择 Educational,然后就可以有1年的使用资格(可以使用全部功能),到期后再重新申请即可。rapidminer使用教程:https://docs.rapidminer.com/...原创 2019-11-11 16:47:58 · 1414 阅读 · 0 评论 -
KNN
https://www.cnblogs.com/mlan/p/8618080.htmlhttps://www.cnblogs.com/John-Geek-2018/p/10148609.htmlhttps://github.com/FLYYZJ/machine_learning_algorithms/tree/master/K_nearest_neighborhttps://www.cnbl...原创 2019-10-18 11:01:54 · 155 阅读 · 0 评论 -
鲁棒性
鲁棒性(robustness)就是系统的健壮性。它是在异常和危险情况下系统生存的关键。比如说,计算机软件在输入错误、磁盘故障、网络过载或有意攻击情况下,能否不死机、不崩溃,就是该软件的鲁棒性。所谓“鲁棒性”,是指控制系统在一定(结构,大小)的参数摄动下,维持某些性能的特性。根据对性能的不同定义,可分为稳定鲁棒性和性能鲁棒性。以闭环系统的鲁棒性作为目标设计得到的固定控制器称为鲁棒控制器。...原创 2019-10-15 21:33:39 · 375 阅读 · 0 评论 -
python数据处理
文章目录dataframeexcel读写数据Pandas不覆盖现有sheet在Excel中写入数据Pandas读取Excel的不同sheet中的数据read_excel()openpyxlRF一个例子dataframe#文件(示例,data数据框并不存在)import pandas as pda=pd.DataFrame(data)a.head(6)a.describe()a.T ...原创 2019-10-14 00:12:31 · 253 阅读 · 0 评论 -
groupby技术
前言Python的pandas包提供的数据聚合与分组运算功能很强大,也很灵活。《Python for Data Analysis》这本书第9章详细的介绍了这方面的用法,但是有些细节不常用就容易忘记,遂打算把书中这部分内容总结在博客里,以便复习查看。根据书中的章节,这部分知识包括以下四部分:1.GroupBy Mechanics(groupby技术)2.Data Aggregation(...转载 2019-10-04 17:34:29 · 2070 阅读 · 0 评论 -
where()函数的用法
import numpy as np#np.where()有两种用法:#1.np.where(condition, x, y)#满足条件(condition),输出x,不满足输出y。aa = np.arange(10)np.where(aa,1,-1)np.where(aa > 5,1,-1)np.where([[True,False], [True,True]],[[1,2...原创 2019-09-29 19:20:35 · 5782 阅读 · 0 评论 -
机器学习:范数及代码实现
#np.linalg.norm(求范数)#linalg=linear(线性)+algebra(代数),norm则表示范数。'''函数参数x_norm=np.linalg.norm(x, ord=None, axis=None, keepdims=False)x: 表示矩阵(也可以是一维)ord:范数类型https://blog.youkuaiyun.com/hqh131360239/articl...原创 2019-09-29 18:37:14 · 593 阅读 · 0 评论 -
numpy基础详解
#关键的一点不是你看了多少书,时时回头看,整理,更加充实,更加精炼import numpy as np#ndarray_n维数组对象,属性#shape:返回一个元组,用于说明ndarray各个维度的长度#ndim:ndarray对象的维度#size:ndarray元素的个数,相当于各个维度长度的乘积#dtype:ndarray中存储的元素的数据类型#itemsize:ndarray...原创 2019-09-29 17:45:25 · 258 阅读 · 0 评论 -
python三维图
#三维图#Axes3D是由matplotAPI提供的一个类,可以用来绘制三维图,matplotlib的Figure类是存放各种图像元素的顶级容器。'''#1.创建一个Figure对象import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfig=plt.figure()#2.利用Figure对象创...原创 2019-09-29 14:38:24 · 901 阅读 · 0 评论 -
导入python自带的一系列数据集等操作
#通过matplotlib实现数据的可视化#sklearn库自带数据集,加载的方式是固定的,站在巨人的肩膀上'''#导入数据集from sklearn.datasets import load_irisfrom sklearn.datasets import load_boston#导入matplotlib绘图模块from matplotlib import pyplot as p...原创 2019-09-29 10:48:39 · 2634 阅读 · 0 评论 -
画图
import matplotlib.pyplot as pltimport numpy as npimport pandas as pd'''x=np.linspace(0,20)plt.plot(x,.5+x)plt.plot(x,1+2*x,'--')#x,y,规定线条格式plt.show()#plt.savefig('first_fig')#savefig()函数可以将图像...原创 2019-09-29 10:47:36 · 179 阅读 · 0 评论 -
机器学习XGBoost——后面的明天更
#https://blog.youkuaiyun.com/cg129054036/article/details/82454117#这个教程挺详细的#XGBoost:处理标准表格数据的领先模型(您在Pandas DataFrames中存储的数据类型,而不是像图像和视频这样的更奇特的数据类型)#非常适合我现在所研究的领域#我的学习目标:#1.使用XGBoost完整建模#2.微调XGBoost#ht...原创 2019-09-28 00:25:20 · 151 阅读 · 0 评论 -
4.1处理缺失数据
#第四章 数据预处理#处理缺失数据#1.识别数据中的缺失数值import pandas as pdfrom io import StringIOcsv_data=\ ''' A,B,C,D 1.0,2.0,3.0,4.0 5.0,6.0,,8.0 10.0,11.0,12.0,''' #如果正在使用python2,需要把字符串解码#csv_...原创 2019-09-28 00:09:54 · 202 阅读 · 0 评论 -
缺失值的处理方法
对于数据挖掘和分析人员来说,数据准备(Data Preparation,包括数据的抽取、清洗、转换和集成)常常占据了70%左右的工作量。而在数据准备的过程中,数据质量差又是最常见而且令人头痛的问题。本文针对缺失值和特殊值这种数据质量问题,进行了初步介绍并推荐了一些处理方法。值得注意的是,这里所说的缺失值,不仅包括数据库中的NULL值,也包括用于表示数值缺失的特殊数值(比如,在系统中用-999来表...原创 2019-08-22 13:27:34 · 3081 阅读 · 0 评论 -
《python数据分析实战》第七章手写
以后建模希望可以直接用到,做个备忘#%%import numpy as npfrom sklearn import datasets,linear_model,svm,neighbors,tree,gaussian_process,neural_network,naive_bayes#%% md# 分类方法使用数据集为:iris#%%iris=datasets.load_iris(...原创 2019-10-04 20:19:43 · 519 阅读 · 0 评论 -
数据可视化与数据预处理
# -*- coding: utf-8 -*-"""Created on Fri Oct 4 20:41:20 2019@author: shenlong"""import osimport numpy as npimport matplotlib.pyplot as pltimport pandas as pd"""代码说明:programmer_1:...原创 2019-10-04 21:44:49 · 1511 阅读 · 0 评论