- 博客(14)
- 资源 (1)
- 收藏
- 关注

翻译 Skip-Gram神经网络体系结构
模型介绍skip-gram神经网络模型最基本的形式实际上是惊人的简单;Word2Vec使用了一个你可能在机器学习中看到过的技巧,我们将训练一个带有单个隐藏层的简单神经网络来完成某个任务,但是实际上我们并没有将这个神经网络用于我们训练的任务。相反,目标实际上只是为了学习隐藏层的权重。另一个技巧是无监督的特征学习,在这里你训练一个自动编码器来压缩隐藏层中的输入向量,并在输出层将其解压缩回原始数据。...
2019-07-22 15:52:59
6955
原创 MySQL之索引
文章目录1. 什么是索引?2. 为什么要使用索引,索引的优缺点?1. 优点2. 缺点3. B树和B+树区别4. Hash索引优劣分析5. MyISAM和InnoDB实现BTree索引方式的区别6. 使用索引时的注意事项1. 什么是索引? 索引是数据库存储引擎用于快速找到记录的一种数据结构。2. 为什么要使用索引,索引的优缺点?1. 优点大大减少服务器需要扫描的数据量,加快数据检索的速...
2020-05-06 22:10:51
517
2
原创 MySQL
文章目录一. MySQL安装二. 用户管理三. DDL:操作数据库和表1. 数据库相关操作2. 表的相关操作四. DML:增删改表中的数据五. DQL:查询表中的记录MySQL中的数据类型一. MySQL安装下载MySQL免安装版的压缩包,我用的是5.7.28版本将压缩包解压,我解压到了D:\MySql\mysql-5.7.28-winx64下配置环境变量此电脑–>属...
2020-04-30 14:43:16
439
1
原创 leetcode437路经总和III
路经总和III题目描述想法这种问题类似于前缀和问题,首先想到的解法是用HashMap来记录遍历到某个节点时整条路径上所以节点的值的和,但是这种方式无法区分所得到的满足条件的解中所有节点都在同一条路径上,(数组是由于路径的唯一性是可以利用这种方式来解决的,具体做法参见leetcode560和为K的数组),想到树的递归特性,考虑利用递归问题来解决这个问题。题目中提出了三个要求:路径不需要...
2020-04-20 16:16:00
224
原创 leetcode78子集
题目描述想法由于数组元素是不重复的,假设数组长度为n,那么子集总数应该是2n2^{n}2n个,且子集的大小为0,1,2…n个,数量分别为Cin,i为子集大小,我们可以采用减治的方法来解决这个问题,以一个普通的输入为例输入nums = {x1,x2,x3.....xn-1,xn}输入大小为n,那么这个输入数组的所有子集可以分成nums1 = {x1,x2,x3....xn-1}的所有子集...
2020-04-18 21:36:19
188
原创 leetcode206反转链表
题目描述非常简单,实现起来也比较容易,但是第一次看的时候有点被吓到了,而且有些地方没想明白,所以做一下记录。迭代迭代的想法是比较简单的,由于ListNode中不含对前面节点的引用,所以为了让链表的方向反转过来,我们需要引入一个指针来指向前面的节点,分别将这两个节点记为prev和curr,那么当前的状态可以这么表示:prev=>curr=>curr.next,在这一步 我们想做的是将...
2020-04-17 15:25:03
147
原创 leetcode160相交链表
看到这道题首先想到的是两个链表相交的部分只可能出现在两个链表的尾部,接着就自然想到了使用两个指针来逐个对比ListNode的值,就有了接下来的方法:简单的想法由于两个链表长度不一定一致,而且我们在遍历一次链表之前没有办法知道两个链表各自的长度,这就导致了我们并能确定从第几个节点开始进行比较,但是可以明确的是,相交的位置肯定不会是长链表的前k个节点,这里k = ListA.size() - Li...
2020-04-16 21:45:47
251
原创 Java进行词频统计并排序
要求:当前目录下给出一个名为"news.txt"的文件,该文件每个word是以空格间隔,标点符号已经被去除,请写出一个完整的可执行的Java程序,对"news.txt"文件中出现的,每个word进行词频统计,并按从大到小的顺序输出出现词频最高的10个word。package com.lyp.exam;import java.io.BufferedInputStream;import jav...
2019-11-06 21:35:29
2842
原创 二叉树、二叉查找树与红黑树的原理及Java实现
JAVA二叉树1. 二叉树在数据量较小的情况下,采用链表可以获得较高的性能(查询时为O(n)),在数据量较大的情况下,链表的检索性能会下降,这时使用二叉树(Binary Tree)进行存储,查询时时间复杂度为O(logn)。下面为二叉树的示意图:{ this.data = data; } public E getData(){ return this.data; } public void setNext(...
2019-08-03 20:55:25
4103
转载 凸优化-下降方法
最近看的论文涉及到了下降方法,所以专门做一个总结,暂时先总结了随机梯度下降法,关于最速下降法和牛顿法以后有时间慢慢总结本文总结的方法包括:梯度下降法随机梯度下降法1.梯度下降法在机器学习算法中,常常根据原始的模型构建出一个代价韩式,然后需要通过优化算法来寻找最合适的参数,使得代价函数的值最小。梯度下降法(Gradient Descent, GD)是最常用的优化方法。梯度下降...
2019-07-22 13:03:49
2380
原创 关于机器学习中相似性度量的一些方法
相似性度量相似性度量指的是在分类或者聚类算法中两个变量(向量)的相似程度,常用的方法是计算两个变量(向量)之间的距离,选择什么样的方法计算距离,计算什么样的距离常常会直接影响分类的效果。本文详细地说明了以下几种常见的相似度量方法的原理。欧式距离曼哈顿距离切比雪夫距离闵科夫斯基距离标准化欧式距离马氏距离汉明距离杰卡德距离/杰卡德相似度皮尔逊相关系数相关系数/相关距离...
2019-07-22 12:26:11
3430
原创 ROC曲线、AUC、Gini系数和KS值
ROC曲线和AUCROC曲线是指受试者工作特征曲线/接收器操作特性曲线(receiver operating characteristic curve),是反应敏感性和特异性连续变量的综合指标,利用构图法揭示敏感性和 特异性的相互关系,它通过将连续变量设定出多个不同的临界值,从而计算出一系列敏感性和特异性,再以敏感性为纵坐标,特异性为横坐标绘制成曲线,曲线下的面积(AUC)越大,诊断准确性越高...
2019-07-21 22:47:45
9218
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人