- 博客(146)
- 资源 (10)
- 收藏
- 关注

翻译 梯度下降优化算法综述
梯度下降优化算法综述 该文翻译自An overview of gradient descent optimization algorithms。 总所周知,梯度下降算法是机器学习中使用非常广泛的优化算法,也是众多机器学习算法中最常用的优化方法。几乎当前每一个先进的(state-of-the-art)机器学习库或者深度学习库都会包括梯度下降算法的不同变种实现。但是,它们就像一个黑盒优化器,很难
2016-09-09 00:21:27
73684
9

原创 机器学习中常见的损失函数
机器学习中常见的损失函数 一般来说,我们在进行机器学习任务时,使用的每一个算法都有一个目标函数,算法便是对这个目标函数进行优化,特别是在分类或者回归任务中,便是使用损失函数(Loss Function)作为其目标函数,又称为代价函数(Cost Function)。 损失函数是用来评价模型的预测值Ŷ =f(X)\hat{Y}=f(X)与真实值YY的不一致程度,它是一个非负实值函数。通常使
2016-09-07 19:16:56
64687
3

原创 Distributional Vector VS. Distributed Vector
Distributional Vector VS. Distributed Vector
2016-08-15 12:03:15
9138

原创 Network Representation 网络节点嵌入
Network Representation最近看了几篇网络节点embedding的论文,思想很新颖,很有趣,这里分享给大家。Network Representation可以翻译为网络(节点)表征、网络(节点)向量、网络(节点)嵌入等… Aim to learn distributed vector representation for each vertex in a network.
2016-08-10 21:21:07
17473
2

原创 Linux下使用Apache的Httpd+Mod_jk+Tomcat搭建Web集群服务
Linux下使用Apache的Httpd+Mod_jk+Tomcat搭建Web集群服务。使用多个tomcat服务器来对请求进行分流,防止单个服务器压力过重。
2016-05-08 01:22:54
13824

翻译 机器学习模型评价(Evaluating Machine Learning Models)-主要概念与陷阱
机器学习模型评价(Evaluating Machine Learning Models)-主要概念与陷阱 本文主要解释一些关于机器学习模型评价的主要概念,与评价中可能会遇到的一些陷阱。如训练集-验证集二划分校验(Hold-out validation)、交叉校验(Cross-validation)、超参数调优(hyperparameter tuning)等。这三个术语都是从不同的层
2015-10-31 22:46:59
92051
3

原创 机器学习中防止过拟合的处理方法
在进行数据挖掘或者机器学习模型建立的时候,因为在统计学习中,假设数据满足独立同分布,即当前已产生的数据可以对未来的数据进行推测与模拟,因此都是使用历史数据建立模型,即使用已经产生的数据去训练,然后使用该模型去拟合未来的数据。但是一般独立同分布的假设往往不成立,即数据的分布可能会发生变化,并且可能当前的数据量过少,不足以对整个数据集进行分布估计,因此往往需要防止模型过拟合,提高模型泛化能力。
2015-10-26 20:58:12
150036

原创 在分类中如何处理训练集中不平衡问题
在分类中如何处理训练集中不平衡问题,在很多机器学习任务中,训练集中可能会存在某个或某些类别下的样本数远大于另一些类别下的样本数目。即类别不平衡,为了使得学习达到更好的效果,因此需要解决该类别不平衡问题。
2015-10-25 23:09:39
136291
14

原创 循环神经网络(RNN, Recurrent Neural Networks)介绍
循环神经网络(RNN, Recurrent Neural Networks)介绍 这篇文章很多内容是参考:http://www.wildml.com/2015/09/recurrent-neural-networks-tutorial-part-1-introduction-to-rnns/,在这篇文章中,加入了一些新的内容与一些自己的理解。 循环神经网络(Recurrent Neural N
2015-09-23 13:24:09
536426
46

翻译 当今世界最NB的25位大数据科学家
在大数据技术飞速发展的今天,谁才是我们大数据科研与工业界中最有威望的科学家呢?下面我们来进行梳理,共罗列了25位当今世界,无论是在学术与工业界都产生巨大影响的数据科学家(Data Scientists)。他(她)们推动了整个领域的发展,毫无疑问,无论是在学术界还是还工业界,他(她)们都是一座座山顶式的人物。他(她)们是我们这些从事大数据产业发展的榜样。
2015-09-20 16:57:14
50589

原创 算法&模型
在行业设备大数据平台建设中,势必要用到大数据技术,而大数据技术中,机器学习与数据挖掘算法是重要的一环,我们通过这些算法与模型对设备的故障进行监控与预测,对设备技改需求进行预测,对设备采购需求进行预测以及创建各种模型与算法设备标签。下面我们对一些常用的算法与模型进行简要介绍。 在进行数据挖掘时,首先要进行商业理解,即我们需要达到什么目的,解决什么问题;其次需要进行数据理解,我们需要哪些数据以及需
2015-09-16 15:23:38
44391
1

原创 前向型神经网络之BPNN(附源码)
神经网络静态神经网络BP算法前向型神经网络BPNN人工神经网络误差反向传播算法Back Propagation数据挖掘机器学习
2015-09-04 20:57:10
54450
3

原创 常见的机器学习&数据挖掘知识点之Basis
常见的机器学习&数据挖掘知识点之BasisSSE(Sum of Squared Error, 平方误差和) SSE=∑i=1n(Xi−X⎯⎯⎯)2SSE=\sum_{i=1}^{n}(X_i-\overline{X})^2SAE(Sum of Absolute Error, 绝对误差和) SAE=∑i=1n|Xi−X⎯⎯⎯|SAE=\sum_{i=1}^{n}|X_i-\overline{X
2015-08-22 02:20:25
13910
1

原创 常用的机器学习&数据挖掘知识(点)
常用的机器学习&数据挖掘知识(点) 声明:想做机器学习&数据挖掘的学弟学妹,可以看看,转载请说明出处...常用的机器学习知识(点)Basis(基础):MSE(Mean Square Error 均方误差),LMS(LeastMean Square 最小均方),LSM(Least Square Methods 最小二乘法),MLE(MaximumLikelihoo
2014-09-15 22:43:18
18871

原创 求凸包+旋转卡壳算法——求平面点集S内点对的最远距离
目录问题:求平面点集S内点对的最远距离... 1解答:... 1一. 凸包... 1二. 旋转卡壳算法... 2三. 算法总复杂度... 8四. C++实现代码... 8五. 测试... 12 问题:求平面点集S内点对的最远距离解答: 其实这个问题的解法就是先求这个点集
2011-12-30 17:17:12
6290

原创 问题:找出二个集合S1与S2之间的最接近点对的距离(包括一个点集中最接近点对的讨论)复杂度为O(nlogn)
问题:找出二个集合S1与S2之间的最接近点对的距离这个问题很容易理解,似乎也不难解决。我们只要将S1每一点与S2每一个的距离算出,找出达到最小距离的两个点即可。然而,这样做效率太低,需要O(n2)的计算时间。在问题的计算复杂性中我们可以看到,一个集合S找出最接近点对的计算时间下界为Ω(nlogn)。这个下界引导我们去找这个问题的一个θ(nlogn)算法。一.先讨论一个集合最接近点对的情况(
2011-12-28 18:43:11
8064

原创 读与复制.BMP文件
// 读与复制.BMP文件.cpp : Defines the entry point for the console application.//#include "stdafx.h"#include#include "Windows.h"#includeusing namespace std;bool readBMP(char *bmpName);bool
2011-11-30 21:11:07
2073

原创 C++学习之七、揭开C++I/O的神秘面纱
揭开C++I/O的神秘面纱 C++通过流(stream)机制来提供比C更先进的输入输出方法。每个流都有一个相关联的源和目的。包括控制台流、文件流、字符串流等。 1.控制台流:流输出:cout输出流方法:put() 和write()是原始的输出方法。这二个方法风别接受一个字符或字符数组,而不是取已经定义了某种输出行为的对象或者变量。传递给这二个方法的数据按照原来的格式输出
2011-11-30 18:40:06
4454
1

原创 C++学习之六、有效的内存管理
有效的内存管理 在程序中使用动态内存优点:1. 动态内存可以在不同的对象与函数之间共享。2. 动态分配的内存空间的大小可以在运行时确定。 预备知识:int i = 7;i实在栈上分配的。int *ptr;ptr = new int;指针ptr在栈上,而ptr指向的内存在堆上。int **handle;handle = new int*;*ha
2011-11-29 20:49:23
1844

原创 C++学习之五、理解C++疑难问题
理解C++疑难问题1. 引用 专业的C++代码都大量使用了引用。C++的引用是另外一个变量的别名。对引用的修改都会改变该引用所指向变量的值。可以把引用看成是一种隐式的指针,它可以免除获取变量地址和对指针解除引用的麻烦。也可以把引用看作是原变量的另一个名字。可以创建独立的引用变量、使用类中的引用数据成员、接受作为传递给函数和方法的参数、从函数和方法返回引用。(1).引
2011-11-29 15:02:54
1973

原创 C++学习之三、探索继承技术
探索继承技术 本文是基于大家已经知道继承技术的基础上强化一些知识 继承的客户视图:Super ↑ Sub类型的对象也是Super类型的对象,因为Sub是从Super继承而来的。Sub 指向对象的指针或者引用可以引用所声明类的对象或其任何子类对象。比如,指向Super的指针可以实际上指向Sub对象,对于引用也是这样。客户代码仍然只访问Super中
2011-11-27 21:42:59
1427
1

原创 C++学习之二、精通类和对象
精通类和对象 本文是基于大家已经知道类和对象的基础上强化一些知识 对象中的动态分配内存: 如果在对象中动态分配了内存,就应当在析构函数中释放该内存,所以此时需要自己编写析构函数。处理复制和赋值: 如果没有自己编写复制构造函数和赋值操作符,C++会帮你生成一个,这些编译器生成的方法分别递归地调用对象成员上的复制构造函数或赋值操作符。不过对于基本
2011-11-27 18:45:48
1419

原创 C++学习之一、掌握类和对象
掌握类和对象---本文是基于大家已经知道类和对象的基础上强化一些知识对象构造:在栈上使用构造函数唯一正确的方法:ClassName myclass(5);在堆上使用构造函数:ClassName *myclass = new ClassName(5);在栈上声明对象就会调用其构造函数,而在堆上可以声明一个类的对象指针,不必立即调用构造函数。在栈上调用默认构造函数要去掉
2011-11-26 21:28:20
1304

原创 C++建立通讯录XML文件(包含XML文件的各种操作)
C++建立通讯录XML文件(包含XML文件的各种操作)本程序用tinyxml解析器对xml文件对其进行解析,工程中只需添加并引用tinyxml的二个头文件和四个源文件tinyxml.h、tinystr.h、tinyxml.cpp、tinystr.cpp、tinyxmlerror.cpp、tinyxmlparser.cpp(有时需要修改一点东西,比如在vs下,这四个源文件需要添加#include
2011-11-26 16:56:56
3091

原创 C++学习之四、重载C++操作符
-----本文是基于大家已经知道重载C++操作符的基础上强化一些知识 为什么要重载操作符1. 让类表现得像内置数据类型一样2. 能够对程序中的表现有更多的控制 操作符重载的限制1. 不能增加新的操作符。2. 有些操作符不能重载3. 不能改变操作符的元数4. 不能改变操作符的优先级5. 不能重新定义内置类型的操作符操作符重载中的选择a.
2011-11-23 21:23:55
1325

原创 C++操作XML之创建(1)
C++操作XML之创建(1) -------------------------------------------XMLElement.h--------------------------------------------------#include#include#include#includeusing namespace std;class XMLEleme
2011-11-23 16:03:58
4496

原创 C++中int型与string型互相转换
像是C#,java等高级语言中,int转String类型都是很简单的,但是C++中比较麻烦: 代码来源:http://gstarwd.iteye.com/blog/547591 int 转换 string string int2str( int num) { if (num == 0 ) return " 0 " ;
2011-11-23 15:53:18
4575

原创 一次一密加密解密算法实现
// 一次一密加密解密算法实现.cpp : Defines the entry point for the console application.//#include "stdafx.h"#include#include#include#includeusing namespace std;#define MAX 1000string key = "";i
2011-11-22 20:54:16
6230

转载 C++string知识大全
string 是C++中的字符串。 字符串对象是一种特殊类型的容器,专门设计来操作的字符序列。C++ Primer书中首先谈到的是构造函数即初始化问题。书中提到了几种常见的构造函数string s1;string s2(s1);string s3("abce");string s4(n,'c');接下来是对string对象的读写:1.读入未知数目的string对象和
2011-11-22 20:16:12
6938

原创 C++文件操作学习
C++文件操作文件流对象:#includeifstream:输入流对象ofstream:输出文件流对象fstream:输入输出文件流对象ifstream file_in;ofstream file_out;fstream file_inout;打开文件一(利用构造函数):ofstream file_out(”c:\\...”,ios::out|ios::bi
2011-11-22 17:38:53
2775
1

原创 STL算法和函数对象
STL算法和函数对象 #include1. find() 在一个迭代器区间内查找一个特定元素,可以对任何类型容器的元素使用此算法。它会返回一个指示所找到元素的迭代器,或者是区间的末尾迭代器,可以查找容器中元素的一个子区间。vector::iterator it = find(myVector.begin()+1,myVector.end(),num);2. find_if() 类似
2011-11-21 22:10:19
2506

原创 用vector、 multimap、 list容器实现好友列表的各种操作 C++
用vector、 multimap、 list容器实现好友列表的各种操作 C++--------------------------------------------------BuddyList.h------------------------------------------------#include#include#include//using std::multim
2011-11-21 18:34:41
1603

原创 错误关联器 C++实现
-----------------------------------------------ErrorCorrelator.h----------------------------------------------#include#include#include#include//error 类声明class Error{public: Error(int p
2011-11-20 18:18:33
1094

原创 Array类模板实现
Array类模板实现---------------------------------------------Array.h------------------------------------------------------ #includeusing namespace std;templateclass Array{public: /* Array(
2011-11-18 19:51:11
2629

原创 哈希链表 操作大全 实现
哈希链表 操作大全 实现//------------------------------Struct.h---------------------- #define MAX 100struct ElemStruct{ char str[MAX]; char info[MAX]; ElemStruct *next;};struct TableStruct{
2011-11-17 21:13:04
1439
计算机硬件知识
2011-10-30
数据结构算法的实现(其中有flash播放)
2011-10-30
程序设计实践(ACM)
2011-10-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人