自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(54)
  • 收藏
  • 关注

转载 HttpServletrequest 与HttpServletResponse总结

转载http://www.cnblogs.com/liuyandeng/p/5336649.htmlHttpServletrequest 与HttpServletResponse总结  如果说DOM是javascript与HTML的桥梁,那么servlet就是前端与后端的桥梁,HttpServletRequest和HttpServletResponse就是之间的信使,好了,...

2018-12-17 10:59:00 210

转载 图片分类top1和top5

Top-5错误率:预测一个图片,如果概率前五中包含正确答案,即认为正确。Top-1错误率:预测一个图片,如果概率最大的是正确答案,才认为正确。转载于:https://www.cnblogs.com/HL-blog/p/9620901.html...

2018-09-10 16:53:00 989

转载 机器学习中对不均衡数据的处理方法

当对于a类型数据占10% b类型的数据占90% 这中数据不均衡的情况采用的方法有:1.想办法获取更多数据2.换一种评判方式3.重组数据:  a.复制 a的数据,使它的数据量和b一样多。  b.减少b的数据,使它的数据量和a一样多。4.使用其他的 机器学习算法5.修改算法。转载于:https://www.cnblogs.com/HL-blo...

2018-08-15 18:43:00 278

转载 python路径

python在描述路径时可以有多种方式,现列举常见的三种方式一:转义的方式'd:\\a.txt'方式二:显式声明字符串不用转义'd:r\a.txt'方式三:使用Linux的路径/ 方式3,在Linux和window下都是行的通的。'd:/a.txt'转载于:https://www.cnblogs.com/HL-blog/p/9482758...

2018-08-15 17:27:00 183

转载 python小工具tqdm和retry

1 from time import sleep 2 from tqdm import trange, tqdm 3 4 #进度条模块tqdm 5 #方法一 6 for i in tqdm(trange(100)): 7 sleep(0.1) 8 #方法二 tqdm对trange做了封装,效果和上方的相同 9 for i in tr...

2018-08-15 16:24:00 201

转载 keras数据预处理

数据预处理在使用 TensorFlow 作为后端的时候,在 Keras 中,CNN 的输入是一个4维数组(也被称作4维张量),它的各维度尺寸为(nb_samples, rows, columns, channels)。其中nb_samples表示图像(或者样本)的总数,rows,columns, 和channels分别表示图像的行数、列数和通道数。下方的...

2018-08-07 18:58:00 529

转载 keras 的使用例子

keras 搭建简单模型扁平化model.add(Flatten()) 可以用 全局平均池化代替model.add(GlobalAveragePooling2D())方法1# 序列模型# 序列模型属于通用模型的一种,因为很常见,所以这里单独列出来进行介绍,这种模型各层之间# 是依次顺序的线性关系,在第k层和第k+1层之间可以加上各种元素来构造神经网络# 这...

2018-08-07 15:48:00 305

转载 python动态调用方法

dd = __import__("test") #这里动态调用了一个模块def aa(ss): print(ss+"666666666666")方法1#使用eval的方式eval("l")("hhhhhh") #直接把方法和参数连起来写,即可,调用l是方法方法2#采用反射的方式l=getattr(dd,"aa") #采用反射,获取方法内存地址。 dd是模块对象,aa是方法名...

2018-08-06 15:55:00 522

转载 周志华《机器学习》版本空间

初步理解:1,数据输入模型后会形成一个假设空间(包含所有可能输入的样本)。2,然后通过 训练数据,抽取 那些和训练数据 特征相匹配的假设,就得到了版本空间。版本空间就是训练后的模型。3,如果预测的 数据A 是版本空间里没有匹配到,那么就会返回false。4,如果数据A是true,但是模型预测错了呢? 那么就把数据A 打上true的标签 放到模型里进行训练,更新版本空...

2018-08-02 08:36:00 236

转载 使用keras,手动搭建卷积模型

#用keras搭建,如下的卷积网络####本文使用keras,搭建卷积模型 1 import numpy as np 2 import tensorflow as tensorflow 3 4 from keras.layers import Conv2D, MaxPooling2D, GlobalAveragePooling2D 5 from keras.la...

2018-07-30 13:46:00 279

转载 TensorFlow 最大池化

由 Aphex34 (自己的作品)CC BY-SA 4.0, 通过 Wikimedia Commons 共享这是一个最大池化的例子max pooling用了 2x2 的滤波器 stride 为 2。四个 2x2 的颜色代表滤波器移动每个步长所产出的最大值。例如[[1, 0], [4, 6]...

2018-07-11 18:30:00 630

转载 TensorFlow 卷积层

TensorFlow 卷积层让我们看下如何在 TensorFlow 里面实现 CNN。TensorFlow 提供了tf.nn.conv2d()和tf.nn.bias_add()函数来创建你自己的卷积层。 1 # Output depth 2 k_output = 64 3 4 # Im...

2018-07-11 18:18:00 182

转载 在linux系统中int、float、short、double各占多少个字节

在linux系统中int、float、short、double各占多少个字节看出只有 long(长整型),void*(c语言中,void为“不确定类型”),在32位4个字节,在64位8个字节。转载于:https://www.cnblogs.com/HL-blog/p/9289977.html...

2018-07-10 16:48:00 2674

转载 随机梯度下降法SGD

梯度下降法需要遍历数据集上百次,数据集越大所花费的时间越多。而现在训练的样本集越来越大,造成梯度下降法造成的时间成本非常高,难以规模化。随机梯度下降法,是从样本集中抽出一小部分数据(随机抽出),用来做梯度下降法。这个虽然会有一点误差,但我们每次只走一小步。他速度更快,并且更容易规模化。ADAGRAD是GSD的改进版,他自动选择了动量和学习率衰减。使用ADAGRAD通常会使学习过程...

2018-07-10 15:27:00 200

转载 tensorFlow的linux基本操作笔记

本文使用的是linux版本的Anaconda环境#创建名为 tensorflow的环境,设置python版本为3.5conda create -n tensorflow python=3.5#进入tensorflow环境source activate tensorflow#安装一些安装包conda install pandas matplotlib jupyter no...

2018-06-25 16:55:00 156

转载 Numpy_构建列向量

NumPy 默认是行向量。你可以用 arr.T 来对数组进行转置,但对一维数组来说,转置还是行向量。所以你可以用 arr[:,None] 来创建一个列向量:print(features)> array([ 0.49671415, -0.1382643 , 0.64768854])print(features.T)> array([ 0.496...

2018-06-20 16:44:00 2752

转载 puthon的random,概率和随机选择

puthon 中随机 概率选择 ,和随机选择 1 import random 2 3 actions = ['u','r','d','l'] 4 qline = {'u':1.2, 'r':-2.1, 'd':-24.5, 'l':27} 5 epsilon = 0.3 # 以0.3的概率进行随机选择 6 7 def choose_action(ep...

2018-05-25 11:55:00 300

转载 强化学习之博弈论——笔记

名词解释:零和博弈:两人的分数相加为0,也是说一个人得分,另一个就减分。有限:也就是 数字 选择 深度等,不是无限大。他是有限制的,一个确定的数。确定性:状态 没有概率 随机转换,比如:执行某个动作,就一定会进入某个状态。完美信息:也就是状态可知,明确知道对方和自己所处的状态。因为 a 先走 b 跟在后边,一人一步。第一步:a 在状态1中可以选择 左...

2018-05-23 18:26:00 1313

转载 强化学习_Q-learning 算法的简明教程

转载于:https://www.cnblogs.com/HL-blog/p/9071215.html

2018-05-22 11:35:00 127

转载 马尔科夫模型(Markov)(MDP)

马尔科夫模型主要元素有3个部分 状态,动作,奖励。对奖励的设置一定慎重,并且深谋远虑。如下图右侧:绿色方块是 生 红色方块是 死,游戏目的是使agent尽快到达绿色方块。1:动作奖励正数过高,会使agent一直在方格世界里兜圈子,不想出去。因为这样每多走一步,都会获得正的奖励。2:动作奖励负数过高,会使agent尽快想逃离这个世界,甚至直接走向红色方块,选择自杀。因为...

2018-05-21 15:06:00 409

转载 panda Datafareme 删除重复数据,保留重复数据

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)参数#用来指定特定的列,默认所有列subset : column label or sequence of labels, optional# keep='first'删除重复项并保留第一次出现的数据,#keep='first'删除重...

2018-05-12 22:29:00 248

转载 pandas Datafarme 拼接,追加数据

concatignore_index=False 保持原有索引 ,True 顺序添加新的索引df = pd.DataFrame([[1, 2], [3, 4]], columns=list('AB'))df2 = pd.DataFrame([[5, 6], [7, 8]], columns=list('AB'))c=pd.concat([df,df2],ignore_...

2018-05-12 17:39:00 212

转载 无监督模型评估_轮廓系数

针对不同情况,有些问题你需要的聚类数目可能是已知的。但是在聚类数目不作为一个先验知道的情况下,我们并不能够保证某个聚类的数目对这个数据是最优的,因为我们对于数据的结构(如果存在的话)是不清楚的。但是,我们可以通过计算每一个簇中点的轮廓系数来衡量聚类的质量。数据点的轮廓系数衡量了它与分配给他的簇的相似度,这个值范围在-1(不相似)到1(相似)。平均轮廓系数为我们提供了一种简单地度量聚类质量...

2018-05-07 19:02:00 620

转载 pandas中DataFrame

python数据分析工具pandas中DataFrame和Series作为主要的数据结构.本文主要是介绍如何对DataFrame数据进行操作并结合一个实例测试操作函数。1)查看DataFrame数据及属性df_obj = DataFrame() #创建DataFrame对象df_obj.dtypes #查看各行的数据格式df_obj['列名'].astype(int)#转...

2018-05-07 14:03:00 138

转载 混合高斯模型 GMM

聚类的方法有很多种,k-means要数最简单的一种聚类方法了,其大致思想就是把数据分为多个堆,每个堆就是一类。每个堆都有一个聚类中心(学习的结果就是获得这k个聚类中心),这个中心就是这个类中所有数据的均值,而这个堆中所有的点到该类的聚类中心都小于到其他类的聚类中心(分类的过程就是将未知数据对这k个聚类中心进行比较的过程,离谁近就是谁)。其实k-means算的上最直观、最方便理解的...

2018-05-03 19:02:00 139

转载 R2系数

用于回归问题决定系数R2,衡量模型预测能力好坏(真实和预测的 相关程度百分比)Y_true是真实的数据,y_pred是预测的数据。使用r2_score()方法可以看到,预测数据和真实数据越接近,R2越大。当然最大值是 1一个模型的R2值为0还不如直接用平均值来预测效果好;而一个R2值为1的模型则可以对目标变量进行完美的预测。从0至1之间的数值,则表示该模型中目...

2018-05-02 20:21:00 1697

转载 pca(主成分分析)

pca主成分分析:可以把高纬度数据在损失最小的情况下转化为低维度数据。显然,PCA可以对数据进行压缩,可以在可控的失真范围内提高运算速度。PCA主要参数:n_components:这个参数可以帮我们指定希望PCA降维后的特征维度数目whiten :判断是否进行白化,就是对降维后的数据的每个特征进行归一化svd_solver:即指定奇异值分解SVD的方法常用方法:输出方...

2018-04-27 11:39:00 234

转载 维度灾难

本文转载自:https://blog.youkuaiyun.com/zbc1090549839/article/details/38929215一.引言这里我们将要讨论所谓的“维数灾难”,同时结合过拟合现象来解释它在分类器学习中的重要性。举一个分类应用的简单例子,假设我们有一系列的图片,每张图片的内容可能是猫也可能是狗;我们需要构造一个分类器能够对猫、狗自动的分类。首先,要寻找到一些能够...

2018-04-25 09:23:00 158

转载 特征缩放_概念

给出这三个人的身高和体重:按照我们的理解,明显Chris应该穿L码,但是根据身高+体重的结果,Chris却应该穿S。这是为什么呢?因为在这里,体重完全主导了结果,身高的影响微乎其微。而我们应该尽量让两者对结果有同等重要的影响。这就引来了特征缩放——把特征都限制在[0,1]之间。解释:X’是你要构建的新特征X(max)和X(min)...

2018-04-24 01:15:00 188

转载 无监督聚类K-means算法

K-mean执行步骤1,根据参数选择聚心的数量 如果分成两类,那么会随机分配两个聚心的位置,并根据聚心的位置给它分配一些点下图 红蓝X就是两个聚心2.计算分配的这些点,距离自己聚心的距离,算出平均值。聚心会根据算出的平均值,移动自己到平均值的位置,再次进行分配点3,继续上一步的操作,迭代多次。直至聚心稳定。 K-means算法,随机聚心的位置,会...

2018-04-22 23:41:00 149

转载 无监督学习——KMeans使用

在当我们获得的数据没有标签时,我们依然希望通过算法学习找到这些数据的特点,这时就用到了KMeans (k均值聚类)把数据点聚类成K个簇文档地址:http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.htmlclasssklearn.cluster.KMeans(n_clusters=...

2018-04-22 01:05:00 178

转载 random_state随机种子

random_state 相当于随机数种子,你可以先看一下图片中的代码和运行结果来了解它的作用。图中设置了random.seed()就相当于在 SVC 中设置了 random_state。第一段和第二段代码完全相同,在1-100中取10个随机数,都没有设置 random seed。 它每次取的结果就不同,它的随机数种子与当前系统时间有关。第三段和第四段代码设置了相同的 ran...

2018-04-20 16:38:00 1406

转载 数据的预处理

准备数据在数据能够被作为输入提供给机器学习算法之前,它经常需要被清洗,格式化,和重新组织 - 这通常被叫做预处理。这个预处理都可以极大地帮助我们提升几乎所有的学习算法的结果和预测能力。转换倾斜的连续特征一个数据集有时可能包含至少一个靠近某个数字的特征,但有时也会有一些相对来说存在极大值或者极小值的不平凡分布的的特征。算法对这种分布的数据会十分敏感,并且如果这种数据没有能够很好...

2018-04-20 14:16:00 202

转载 网格搜素算法的使用

GridSearchCV网格搜索算法,经常用于调优模型参数,遍历多个模型参数,带入模型,进行训练,从中找出评分最高的模型。GridSearchCV(参数1,参数2,参数3,参数4=none)参数1:模型算法   参数2:需要调优的参数 参数3:评分标准 参数4:k折交叉验证法,默认为空GridSearchCV的方法:grid.best_estimator_...

2018-04-19 15:45:00 353

转载 分类器评分指标F-score和精确率(Precision)

F-score 是 精确率(Precision)和召回率(Recall)评估指标的调和值beta<1,表示越看中精确率(查准率) beta>1,表示越看中召回率(查全率) beta=1 ,表示两者都很重要fbeta_score,参数1 真实值 参数2 预测值 一定不要写错,否则会算不准示例:1 # TODO:从sklear...

2018-04-18 19:53:00 1840

转载 机器学习_监督算法的优缺点

决策树_应用场景回答:信用贷款审批;邮件分类**这个模型的优势是什么?他什么情况下表现最好?**回答:易于使用,容易理解,清晰的显示那些字段比较重要。对缺失值不敏感,可以处理不相关特征数据,运算速度比较快。 在特征比较少和特征关联性不强的表现最好。**这个模型的缺点是什么?什么条件下它表现很差?**回答:容易过拟合,尤其是在数据特征比较多的情况下。在分类的情况下,是根...

2018-04-18 10:10:00 1192

转载 机器学习——集成学习算法的理解

集成学习是一种把多个 个体学习器(弱学习器)组成一个强学习器的算法。可以把它当做一种优化策略。个体学习器:实际是一种机器学习的算法训练的模型,如:决策树,支持向量机,神经网络 等。弱学习器:准确率略高于随机猜测的个体学习器。比如在二分类问题上:男和女。随机猜测正确的概率为50%,而弱学习器的准确率 略高于50%。多个同样算法的个体学习器 的组合 叫做同质。如果其中还包含的...

2018-04-16 18:39:00 219

转载 python学习笔记——拾壹

RabbitMQ 六种模式 Redis 可存放的五种数据协程和io多路复用的区别都继承了相同的类 libevent.so协程也可以理解是io多路复用io多路复用更偏向io一点协程是更上层的一种封装 偏向于函数的切换。RabbitMQ 消息队列1.单发送单接收2.单发送多接收3.广播、订阅模式4.有选择的接收消息 Rou...

2017-10-18 17:47:00 190

转载 python学习笔记——拾

多进程,进程queue,pipe管道,进程锁,进程池,协程,5种网络模式(阻塞io,非阻塞io,信号驱动io,io多路复用,异步io)多进程import multiprocessing每个进程都会由他的父进程进行启动windows中是pycharmlinux中是 multiprocessing获得进程idimport os#获取子进程idprin...

2017-10-18 17:22:00 171

转载 python学习笔记——玖

模块improt paramikoLinux连接客户端importparamikossh =paramiko.SSHClient()ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy())ssh.connect("某IP地址",22,"用户名", "口令")stdin, stdout, ...

2017-10-02 20:39:00 103

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除