- 博客(14)
- 收藏
- 关注
原创 用Python将.mat转化为DataFrame
做机器学习时需要把数据处理成feature,label的形式,我习惯用pandas.DataFrame的格式。有很多大型的数据集是.mat格式,本文详细记录了我将.mat转换为dataframe格式的过程。先看一眼在matlib打开时这样的????9000*1 点开是这样的????1.导入.mat数据import scipy.io as scioimport pandas as pddata_path='mill.mat'data=scio.loadmat(data_path)#查看
2020-08-21 16:33:03
3376
转载 python小波分析:pyWavelets中文手册
转载自:https://www.docin.com/p-74261596.html终于找到一个能看懂的o( ̄▽ ̄)ブ
2020-04-17 19:01:31
4655
转载 基于小波变换多尺度空间能量分布特征提取方法
基于小波变换多尺度空间能量分布特征提取方法转载自:https://write-bug.com/article/1940.html小波分析技术可以把信号在各频率波段中的特征提取出来,基于小波变化的多尺度空间能量分布特征提取方法是对信号进行频带分析,再分别以计算所得的各个频带的能量作为特征向量。信号f(t)的二进小波分解可表示为:f(t)=Aj+ΣDjf(t) = Aj + ΣDjf(t)...
2020-04-17 18:47:43
3938
原创 监督学习的基本假设——联合概率分布,独立同分布
输入空间X与输出空间Y遵循联合概率分布:P(X,Y) P(X,Y)P(X,Y)并依联合概率分布P(X,Y)独立同分布产生。联合概率分布:两个及以上随机变量组成的随机变量的概率分布独立同分布:在概率统计理论中,指随机过程中,任何时刻的取值都为随机变量,如果这些随机变量服从同一分布,并且互相独立,那么这些随机变量是独立同分布。如果随机变量X1和X2独立,是指X1的取值不影响X2的取值,X2的...
2020-01-08 11:33:48
4656
原创 网格搜索scoring的取值
https://scikit-learn.org/stable/modules/model_evaluation.html#scoring-parameter
2019-12-30 15:57:53
1713
原创 sklearn机器学习包常用函数(连载)
做机器学习案例时,每个案例都会用到sklearn中不同的函数,导包时真的很头大!!!到底用哪个?为什么有的是model_selection?有的是feature_selection?有的是feature_extraction?有的是processing?本文就是为了解决自己的这个问题而写。(择日填坑✌)第一部分:收集整理函数名(完成)第二部分:每个函数的作用(未完成)第三部分:每个函数的应用...
2019-12-26 19:28:05
414
原创 案例:决策树decision tree泰坦尼克号幸存者预测
案例包括:(1)数据预处理(2)模型训练(3)最有参数选择(交叉验证)1 数据预处理import pandas as pddef read_data(path): """数据预处理""" df=pd.read_csv(path,index_col=0) #丢弃无用数据 df.drop(['Name','Cabin','Ticket'],axis=1,inpla...
2019-12-24 20:18:41
893
原创 案例:逻辑回归Logistic Regression做乳腺癌预测
使用逻辑回归算法解决乳腺癌检测问题,使用sk-learn自带的乳腺癌数据集导入数据from sklearn.datasets import load_breast_cancercancer=load_breast_cancer()X=cancer.datay=cancer.targetprint('data shape:{0};positive:{1},negative:{2}'.fo...
2019-12-22 21:29:01
9347
6
原创 案例:线性回归Linear Regression房价预测
使用scikit-learn自带的波士顿房价数据集输入特征from sklearn.datasets import load_bostonfrom matplotlib import pyplot as plt%matplotlib inlineboston=load_boston()X=boston.dataY=boston.targetX.shape(506, 13)bo...
2019-12-22 12:24:38
1016
原创 练习:线性回归Linear regression
用线性回归算法拟合正弦函数生成数据import numpy as npimport matplotlib.pyplot as plt%matplotlib inline#生成200个[-2pi,2pi]之间的正弦函数上的点,并加上随机噪声n_dots=200X=np.linspace(-2*np.pi,2*np.pi,n_dots)Y=np.sin(X)+0.2*np.random...
2019-12-21 16:58:49
212
原创 案例:K-均值糖尿病预测
1、加载数据import pandas as pd%matplotlib inlinedata=pd.read_csv('diabetes.csv')data.head(5) Pregnancies Glucose BloodPressure SkinThickness Insulin ...
2019-12-21 15:58:06
890
原创 练习:K—近邻算法做分类,回归
完成python基础+numpy\pandas\matplotlib+机器学习算法原理学习,现在开始做练习题及案例。参考教材:黄永昌《scikit-learn机器学习常用算法原理及编程实践》代码明明和书上一!模!一!样!,为什么运行错误❌哭唧唧/(ㄒoㄒ)//(ㄒoㄒ)/。我对课本的内容进行修改,并给出了修改理由。新手上路,请多指教(★ ω ★)(★ ω ★)1 Kneighbors Cla...
2019-12-16 21:10:04
410
原创 为什么我的jupyter一直Connection failed❓
Connection failed:A connection to the notebook server could not be established. The notebook will continue trying to reconnect. Check your network connection or notebook server configuration.
2019-12-16 17:36:16
11068
11
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人