xiaohuixiao！-优快云博客

原创调节图像亮度

import cv2import numpy as npimport math def gamma_trans(img, gamma): # gamma函数处理 gamma_table = [np.power(x / 255.0, gamma) * 255.0 for x in range(256)] # 建立映射表 gamma_table = np.round(np.array(gamma_table)).astype(np.uint8) # 颜色值为整数 retur

2020-10-28 09:16:55 398

原创 OCR调研

将图片翻译成文字一般被称为光学文字识别（Optical Character Recognition，OCR）。可以实现OCR 的底层库并不多，目前很多库都是使用共同的几个底层OCR 库，或者是在上面进行定制。Tesseract 是一个OCR 库，目前由Google 赞助（Google 也是一家以OCR 和机器学习技术闻名于世的公司）。Tesseract 是目前公认最优秀、最精确的开源OCR 系统。除了极高的精确度，Tesseract 也具有很高的灵活性。它可以通过训练识别出任何字体（只要这些字体的风格保

2020-10-19 13:38:39 564

原创使用Pycharm将项目上传到github

使用Pycharm将项目上传到github

2020-10-13 10:45:03 271

原创 opencv用dnn.readNet加载caffe/torch/darknet/tensorflow的模型和权重

opencv用dnn.readNet加载caffe/torch/darknet/tensorflow的模型和权重

2020-09-15 16:41:58 671

原创基于图像的表情识别

参考文档：人脸识别之表情识别（七）–面部表情识别阶段综述一、FER介绍Facial Expression Recognition 面部表情识别，以下简称FER完整的FER包含静态图像FER和动态序列FER。静态图像FER，就是我们通常意义上的图片表情识别了，动态序列FER是基于视频序列建模，如RNN方式等。基于静态图像的FER方法主要还是基于静态图像的FER。主流的方式，从传统的手工特征（LBP,LBP-TOP等），浅层学习（SVM，Adaboost等），深度学习（CNN，DBN，RNN）二

2020-09-02 10:42:44 2467 1

原创启发式算法

参考：启发式算法 (Heuristic Algorithms)启发式算法（Heuristic Algorithm)遗传算法详解（GA)【优化】遗传算法介绍优化 | 粒子群算法介绍启发式算法简介：人在解决问题时所采取的一种根据经验规则进行发现的方法。其特点是在解决问题时,利用过去的经验,选择已经行之有效的方法，而不是系统地、以确定的步骤去寻求答案。启发式解决问题的方法是与算法相对立的。算法是把各种可能性都一一进行尝试，最终能找到问题的答案，但它是在很大的问题空间内，花费大量的时间和精力才能求

2020-08-21 14:42:15 1481

原创强化学习Q-learning

强化学习：先行动起来，如果方向正确那么就继续前行，如果错了，子曰：过则勿惮改。吸取经验，好好改正，失败乃成功之母，从头再来就是。总之要行动，胡适先生说：怕什么真理无穷，进一寸有一寸的欢喜。即想要理解信息，获得输入到输出的映射，就需要从自身的以往经验中去不断学习来获取知识，从而不需要大量已标记的确定标签，只需要一个评价行为好坏的奖惩机制进行反馈，强化学习通过这样的反馈自己进行“学习”。（当前行为“好”以后就多往这个方向发展，如果“坏”就尽量避免这样的行为，即不是直接得到了标签，而是自己在实际中总结得到的）

2020-08-20 17:00:34 264

原创遗传算法的优化

1、基于改进遗传算法的大型海上风电场优化电网设计(Optimal Electric Network Design for a Large Offshore Wind Farm Based on a Modified Genetic Algorithm Approach)主要内容：在本文中，考虑到专门为本地WT收集器系统中的径向拓扑设计的特定情况，提高了GA的效率。对于此建议，遗传算法与用于解决经典多次旅行推销员问题（mTSP）的解决方案方法相结合。遗传算法——解决M-TSP多旅行商问题（基于pyt

2020-08-20 16:57:02 2014

原创论文

A review of offshore wind farm layout optimization and electrical system design methods1、主要内容电压电平选择在内的电气组件优化策略专注于内部电缆连接布局优化海上变电站（OS）的数量和位置2、电缆连接布局电缆的连接方案应从两个方面考虑：不允许交叉布置，并且在满负载条件下每根电缆中的电流不应超过响应电缆的载流能力。主要通过确定性方法进行优化，例如最小生成树算法[34]，旅行商问题[35]算法和开放式车辆路

2020-08-19 16:13:33 258

原创矫正算法

参考：OpenCV-Python的文本透视矫正与水平矫正图像矫正技术深入探讨1、基于轮廓提取的矫正算法比如我们要矫正这张人民币，思路应该是怎么样？首先分析这张图的特点。在这张图里，人民币有一定的倾斜角度，但是角度不大；人民币的背景是黑色的，而且人民币的边缘应该比较明显。没错，我们就抓住人民币的的边缘比较明显来做文章！我们是不是可以先把人民币的轮廓找出来（找出来的轮廓当然就是一个大大的矩形），然后用矩形去包围它，得到他的旋转角度，然后根据得到的角度进行旋转，那样不就可以实现矫正了吗！再详细地

2020-08-11 09:05:48 1343

原创 Python实现图片裁剪的两种方式——Pillow和OpenCV

Python实现图片裁剪的两种方式——Pillow和OpenCV

2020-08-07 17:26:27 285

原创使用jTessBoxEditorFX制作自己的字库

1、下载jTessBoxEditorFX注意jTessBoxEditor有两个版本，带FX的版本才支持中文字符编辑，我们下载带FX版本的。在这个网址上列出了所有的jTessBoxEditorFX版本。选择了jTessBoxEditorFX-2.2.0安装我们将图片放到jTessBoxEditorFX目录下新建的train_image文件夹下。点击jTessBoxEditorFX.jar文件2、生成tif文件选择 Tools -> Merge TIFF，打开对话框，选择训练样本所在

2020-08-06 17:38:10 3470 1

原创 http协议中各个响应状态返回值（200、400、404、500等）的含义

http协议中各个响应状态返回值（200、400、404、500等）的含义

2020-07-28 11:27:14 1730

原创 model.evaluate 和 model.predict 的区别

model.evaluate 和 model.predict 的区别

2020-07-27 11:05:27 1211

原创 bert在多分类等应用

参考：BERT: Pre-training of Deep Bidirectional Transformers for Language UnderstandingBert时代的创新（应用篇）：Bert在NLP各领域的应用进展一、bert原理1、应用领域：文本分类文本分类是个NLP中历史悠久，源远流长……总之比较成熟的应用领域。它的意思是给定一个文档，模型告诉这是哪个类别，是讲的“体育”还是“娱乐”，总之就是这个意思。那么，Bert应用在这个领域效果如何呢？目前也有工作。论文：DocBER

2020-07-23 13:27:02 1356 1

原创 nlp复习--seq2seq & attention

seq2seqseq2seq又叫Encoder-Decoder模型。它可以实现从一个序列到任意一个序列的转换，模型如下所示，其左半部分为Encoder部分，右半部分为Decoder部分。在翻译的应用中，可以理解为看完一个句子，提炼出它的大意Seq2Seq模型中的向量 c就代表着context vector，即含有所有输入句信息的向量。缺点基础的Seq2Seq有一些缺点，因为Encoder将输入编码为固定大小状态向量的过程实际上是一“信息有损压缩”的过程，如果信息量越大，那么这个转化向量的过程对信

2020-06-26 17:50:12 612

原创 nlp期末复习--文本分类

整个文本分类问题就拆分成了特征工程和分类器两部分。特征工程分类器1、特征工程文本特征工程分为文本预处理、特征提取、文本表示三个部分。文本预处理：中文文本处理中主要包括文本分词和去停用词两个阶段。特征提取：特征选择的基本思路是根据某个评价指标独立的对原始特征项（词项）进行评分排序，从中选择得分最高的一些特征项，过滤掉其余的特征项。（TF-IDF方法）文本表示：文本表示的目的是把文本预处理后的转换成计算机可理解的方式，是决定文本分类质量最重要的部分。（传统做法常用词袋模型（BOW,

2020-06-26 14:26:46 474

原创 nlp期末复习-循环神经网络

RNN为什么会有记忆功能呢？因为在下一次的计算中，隐藏单元也和输入一起参与了运算。我们知道隐藏单元是输入的计算结果；因此可以在一定程度上保留输入的信息。怎么理解呢？注：输出结果后更新隐藏值，就是这次算的的隐藏值下次使用lstmGRU...

2020-06-26 13:41:21 288

原创 nlp期末复习-词向量

1、不能体现词的含义进行编码（one-hot）2、单词按照含义进行编码成向量的方式称为word embeddingWord Embedding：Word2Vec(CBOW/Skip-gram)—>Glove使用Word Embedding：句子中每个单词以Onehot形式作为输入，然后乘以学好的WordEmbedding矩阵Q，就直接取出单词对应的Word Embedding了Word2VecCBOW模型的训练输入是某一个特征词的上下文（context）相关的词对应的词向量，而输出

2020-06-24 10:45:32 413

原创 nlp复习--神经网络基础

1、神经网络技术发展2、那么感知器怎么样能训练出权重呢？首先，所有的权重参数都是随机的；然后根据一个标准【代价函数】，使用一些方法【梯度下降】更新权重，直到这个标准【代价函数】的值足够好；或者权重每次更新的值足够小。3、梯度下降梯度下降中的梯度指的是代价函数对各个参数的偏导数，偏导数的方向决定了在学习过程中参数下降的方向，学习率（通常用α表示）决定了每步变化的步长，有了导数和学习率就可以使用梯度下降算法（Gradient Descent Algorithm）更新参数了。☞我们目标是求这个损失函数

2020-06-23 15:59:04 306

原创 nlp期末复习--介绍

自然语言处理的历程：上下文无关的文法---->利用统计语言学的方法自然语言处理的领域：1、拼写纠正2、文本分类3、机器翻译4、词向量5、自然语言生成6、人机对话系统

2020-06-22 20:42:12 326

原创 Batch Normalization--批标准化

批标准化介绍：机器学习领域有个很重要的假设：IID独立同分布假设，就是假设训练数据和测试数据是满足相同分布的，这是通过训练数据获得的模型能够在测试集获得好的效果的一个基本保障。而BatchNorm是干啥的呢？BatchNorm就是在深度神经网络训练过程中使得每一层神经网络的输入保持相同分布的。一、数据分布对训练会产生影响？？？答案是肯定的。比如某个神经元 x 的值为1, 某个 Weights 的初始值为 0.1, 这样后一层神经元计算结果就是 Wx = 0.1; 又或者 x = 20, 这样 Wx

2020-06-09 21:41:05 297

原创 pytorch中net.eval() 和net.train()的使用

pytorch中net.eval() 和net.train()的使用

2020-06-08 21:31:35 6282

原创莫烦python---pytorch学习（下）

CNNRNNLstm自编码DQN 强化学习GAN 生成对抗网络

2020-06-04 13:48:56 1325

原创莫烦python---pytorch学习（中）

1、搭建神经网络模块# 方法一class Net(torch.nn.Module): # 继承 torch 的 Module def __init__(self, n_feature, n_hidden, n_output): super(Net, self).__init__() # 继承 __init__ 功能 self.hidden = torch.nn.Linear(n_feature, n_hidden) # 隐藏层线性输出

2020-06-04 13:38:44 345

原创 pycharm 无法显示动态图片matplotlib

1、pycharm—》Preferences输入关键字Scien…搜索出Python Scientific，在右侧去掉对勾（默认是勾选的），然后右下角Apply–OK，即可完美解决。

2020-06-03 16:59:47 892

原创莫烦python---pytorch学习（上）

一、推荐学习网站：莫烦python二、pytorch学习1、介绍PyTorch是一个非常有可能改变深度学习领域前景的Python库。PyTorch是一个基于Python的库，用来提供一个具有灵活性的深度学习开发平台。PyTorch的工作流程非常接近Python的科学计算库——numpy。优点：易于使用的API—它就像Python一样简单。Python的支持—如上所述，PyTorch可以顺利地与Python数据科学栈集成。它非常类似于numpy，甚至注意不到它们的差别。动态计算图—取代了

2020-06-02 20:26:41 1547

原创 MAC中python中文出现乱码方格——matplotlib画图

问题：中文出现乱码方格，添加下方代码也没法正常使用。plt.rcParams['font.sans-serif'] = 'SimHei'解决：1、下载SimHei字体 —SimHei.tffSimHei字体下载2、将下载的文件复制到 /Library/Fonts（Mac 电脑：资源库/Fonts）3、将下载的文件复制到 /Users/zhaxiaohui/anaconda3/pkgs/matplotlib-3.1.0-py37h54f8f79_0/lib/python3.7/site-pa

2020-06-02 20:18:36 375

原创 nlp-自然语言处理三大特征抽取器（CNN/RNN/TF）比较

资料参考：放弃幻想，全面拥抱Transformer：自然语言处理三大特征抽取器（CNN/RNN/TF）比较一、nlp四大类任务一类是序列标注，这是最典型的NLP任务，比如中文分词，词性标注，命名实体识别，语义角色标注等都可以归入这一类问题，它的特点是句子中每个单词要求模型根据上下文都要给出一个分类类别。第二类是分类任务，比如我们常见的文本分类，情感计算等都可以归入这一类。它的特点是不管文章有多长，总体给出一个分类类别即可。第三类任务是句子关系判断，比如Entailment，QA，语义改写，自然语

2020-05-29 21:52:41 1575 1

k-means算法优化

一、k-means算法介绍k-means 算法是首先从含有n个数据对象的数据集中随机选择K个数据对象作为初始中心。然后计算每个数据对象到各中心的距离，根据最近邻原则，所有数据对象将会被划分到离它最近的那个中心所代表的簇中。接着分别计算新生成的各个簇中数据对象的均值作为各簇新的中心，比较新的中心和上一次得到的中心，如果没有发生变化，则算法收敛，输出结果；如果新的中心和上一次的中心相比发生变化，则要以新的中心对所有数据对象重新进行划分。直到满足算法的收敛条件为止。二、缺点和优化方法K-means聚类

2020-05-26 09:40:28 2006

原创如何在vscode上刷力扣题目

如何在vscode上刷力扣题目

2020-05-21 20:31:37 1605

原创剑指刷题-面试题55 - I. 二叉树的深度

题目：输入一棵二叉树的根节点，求该树的深度。从根节点到叶节点依次经过的节点（含根、叶节点）形成树的一条路径，最长路径的长度为树的深度。解法：方法一：递归法# Definition for a binary tree node.# class TreeNode(object):# def __init__(self, x):# self.val = x# self.left = None# self.right = Nonecl

2020-05-20 20:20:23 163

原创人脸识别-SeetaFace/face_recognition

人脸识别介绍：人脸检测/跟踪的目的是在图像/视频中找到各个人脸所在的位置和大小；对于跟踪而言，还需要确定帧间不同人脸间的对应关系。人脸特征点定位的目的是在人脸检测/跟踪获取的人脸区域的基础上，进一步，确定脸部特征点（眼睛、嘴巴中心点、眼睛、嘴巴轮廓特征点、器官轮廓特征点等）的位置。人脸特征点定位的基本思路，主要是将人脸局部器官的纹理特征和器官特征点之间的位置约束进行结合来进行处理。人脸表示是指根据人脸特征点的位置，对人脸进行几何校正并割取人脸区域（归一化到固定大小）之后，得到最具有鉴别（区分）能力的特

2020-05-20 15:51:27 1216

空空如也

空空如也