- 博客(8)
- 资源 (2)
- 收藏
- 关注
原创 GAN初探
1. 简述GAN由两个网络构成:generator和discriminator,generator负责生成数据,discriminator判断输入数据是真实的还是由generator生成的。以图片生成为例,generator输入一个随机向量,输出一张图片;discriminator是一个二分类器,输出这张图片是真实数据的概率。GAN的训练过程:首先固定住generator,然后更新disc...
2019-05-04 14:42:42
268
原创 轮盘赌算法的两种实现
有时候我们需要按照元素的权重随机选择下一个元素。例如在random walk算法中,我们需要根据边的权重选择下一个节点,边的权重越大,下一个节点被选中的概率也就越大。假设我们以邻接表的方式保存图,那么选择下一个节点的算法如下所示,这是最朴素的方法。这种方法每次选择下一个节点的时候都要遍历当前节点的所有邻接节点。double myRandom(){ return random() ...
2019-02-13 16:31:20
4378
2
原创 常见的距离计算方式和相似度计算方式
1. 距离计算方式1.1 欧式距离(直线距离) 和 分别为两个n维向量,距离计算公式为:当不同维度的量纲不一致时,量纲大的维度权重会变大,解决方式为: 1). 向量归一化 2). 欧式距离标准化。其中为第i个维度的标准差(根据整个数据集计算) 3). 马氏距离 欧式距离: 马氏距离: ...
2018-09-13 11:21:16
1345
原创 信息熵,条件熵,信息增益与信息增益比
1. 信息熵熵表示随机变量不确定性的度量。设 是一个取有限值的离散随机变量,其概率分布为 那么随机变量 的信息熵为 ...
2018-08-04 14:11:29
669
原创 python进程池的使用
def fun(i, _list): _list.append(i)def main(): q = multiprocessing.Queue() # 线程安全的队列,可以再多进程之间传递数据 for i in [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]: q.put(i) pool = multiprocessing.Poo...
2017-09-26 17:55:06
465
原创 python使用requests爬网页编码问题
当我们使用requests爬网页的时候,如html = requests.get(url).textprint html会报以下编码错误:UnicodeEncodeError: 'gbk' codec can't encode character u'\x82' in position 71: illegal multibyte sequence
2017-09-26 17:53:07
567
原创 CentOS6.5 非root用户(普通用户)安装mysql
有时候我们借用别人的服务器,要使用5.5以上版本的mysql,但是别人已经安装了5.1版本的mysql。这个时候我们就要在自己的用户下面单独安装mysql了。
2017-09-26 17:51:58
2449
原创 spring boot MySQL保存emoji表情
首先设置mysql的字符集为utf8mb4就不说了。设置application.yml:url: jdbc:mysql://localhost:3306/fp?useUnicode=true&characterEncoding=utf8type: com.zaxxer.hikari.HikariDataSourcehikari: connection-init-sql: SET NAMES
2017-09-26 17:47:42
2291
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人