- 博客(16)
- 收藏
- 关注
转载 将博客搬至优快云
由于发现优快云的博客现在做了不少改进,UI方面也越来越人性化了,现将博客搬迁至优快云.地址为:http://blog.youkuaiyun.com/fy2462欢迎大家来参观。转载于:https://www.cnblogs.com/michaelGD/p/3774836.html...
2014-06-07 15:25:00
143
转载 基于余弦距离的的文本相似度挖掘(C++算法)
本文实现了根据余弦距离的文本相似度的C++实现算法,如要要点如下:1、对1998年1月的人民日报所有文章进行预处理(其中文件已经分化好分词),然后进行去噪声、去停用词等操作。2、对处理好的数据进行余弦计算,并存储为相应的数据结构。3、输出前N篇最相似的文章下面介绍Statistics.cpp,对预处理文件进行统计词频。 1 #pragma once 2 #...
2013-03-18 16:09:00
420
转载 数据库读写锁的C++实现
一、基本概念在数据库中,对某数据的两个基本操作为写和读,分布有两种锁控制:排它锁(X锁)、共享锁(S锁)。排它锁(x锁):若事务T对数据D加X锁,则其它任何事务都不能再对D加任何类型的锁,直至T释放D上的X锁; 一般要求在修改数据前要向该数据加排它锁,所以排它锁又称为写锁。共享锁(s锁):若事务T对数据D加S锁,则其它事务只能对D加S锁,而...
2013-01-24 14:21:00
253
转载 字符串移位包含问题
在编程之美3.1中,此题解法是用strstr()函数,并且以空间换时间,其实只要用循环遍历即可其时间复杂度: k < O(n) < k+ n, 其中k为查找串的长度,n为数据串的长度,空间复杂度为O(1)。代码如下: 1 #include<iostream> 2 using namespace std; 3 4 int findSu...
2012-12-20 21:42:00
158
转载 【转】强大的矩阵奇异值分解(SVD)及其应用
在工程实践中,经常要对大矩阵进行计算,除了使用分布式处理方法以外,就是通过理论方法,对矩阵降维。一下文章,我在学习SVD时发现的好文,推荐给大家,原始地址为:http://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applications.html原文如下:前言: 上一次写了关于PCA与LDA的文章...
2012-12-18 17:11:00
116
转载 ACE多线程服务器
ACE(Adaptive Communication Environment),它是一个面向对象的、跨平台的、开放源码的网络编程基础设施框架。 ACE 是由加利福尼亚大学Irvine分校的Douglas C.Schmidt 博士主导开发的,是一种跨平台可编译的网络编程API,并随后在工业界中发展、完善,它将底层的不同系统的细节透明化,为开发者提供统一的接口,从而可在不同...
2012-11-30 20:46:00
154
转载 最大公约数的快速求法
本题为编程之美中的第2.7题,上面的解法比辗转相除发的时间复杂度要小很多。看完之后用while循环代替了递归重写了一下。废话少说,上源码: 1 #include <iostream> 2 using namespace std; 3 4 int GDC(unsigned long long x, unsigned long long y) 5 {...
2012-11-28 15:56:00
373
转载 并查集的实现
1、概述 并查集(Disjoint set或者Union-find set)是一种树型的数据结构,常用于处理一些不相交集合(Disjoint Sets)的合并及查询问题。2、基本操作 并查集是一种非常简单的数据结构,它主要未来解决如下两种经常性操作而产生的,分别为: A. 合并两个不相交集合 B. 判断两个元素是否属于同一个集合(经常性)(1)合并两个不相...
2012-11-28 15:47:00
322
转载 找出出现次数最多的几个数值
这道题目所说的出现最多的几个数值,其实是带有附加条件的: 这几个数值中出现次数最少的那个数,要比除这几个值外的其他数的总个数要多。(说的自己都有点晕-_-!)这样才能在最后结果中,呈现这几个数。所以必须按照数据源中的统计量分析出求前几位的数值。其代码如下: 1 #include <iostream> 2 #include <hash_map&g...
2012-11-23 22:23:00
332
转载 寻找最大的K个数
这是一道很普遍和基础的题目,有很深的扩展性。一、首先,第一反应往往会想到快速排序后,再输出K个元素,但是时间复杂度为O(N*logN/log2) + O(K) = O(N*logN/log2)。 另外一种做法是,通过冒泡排序选出K个最大的出来,它的时间复杂度为O(N*K)。 这就要比较K < logN/log2 ? K : logN/lo...
2012-11-21 19:35:00
176
转载 决策树C4.5分类算法的C++实现
公司布置了一个任务让写一个决策树,以前并未接触数据挖掘的东西,但作为一个数据挖掘最基本的知识点,还是应该有所理解的。 程序的源码可以点击这里进行下载,下面简要介绍一下决策树以及相关算法概念。 决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径...
2012-11-14 23:00:00
858
转载 在10进制和2进制中,从0到N总共包含1的数目
这是一道比较传统的面试题,自己写了个10进制的求1个数的程序,后来在《编程之美》中发现上面的解法更好一些,随后有用它的方法重写了一遍2进制下的求解方法。 程序源码请点击这里下载。 对于自己写的10进制程序:主要思想还是从前期的分析得出来的: 1、先统计N的相应位置所对应的累加和数组 2、从前到后,根据所当前位置对应的位数,进行累加,即: 1)...
2012-11-14 17:36:00
139
转载 【转】SVM算法入门
转自:http://www.blogjava.net/zhenandaci/category/31868.html(一)SVM的简介支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中[10]。 支持向量机方法是建立在统...
2012-11-13 20:01:00
111
转载 【转】文本分类入门
来源 http://www.blogjava.net/zhenandaci/category/31868.html?Show=All文本分类入 门(一)文本分类问题的定义文本分类系列文章,从文本分类问题的定义开始,主要讲解文本分类系统的构成,主流的统计学习方法以及较为优秀的SVM算法及其改进。 一个文本(以下基本不区分“文本”和“文档”两个词的含义)分类问题就是将...
2012-11-13 20:00:00
206
转载 二叉树中查找两个节点的最低公共祖先
这是一道企业面试中,经常会被问到的面试题目。在网上看到一些此题的实现,其中有两种方法是比较适合编程的。本项目的源代码,请点击这里下载。方法一: 此方法是根据二叉树的DFS查找并标记祖先,根据递归出栈的原理,找到公共祖先。 其主要代码如下: 1 #include <iostream> 2 #include <list> 3 #in...
2012-11-12 19:27:00
143
转载 nutch安装与测试
一、nutch 介绍(来自百度百科) Nutch是一个由Java实现的,刚刚诞生开放源代码(open-source)的web搜索引擎。尽管Web搜索是漫游Internet的基本要求, 但是现有web搜索引擎的数目却在下降. 并且这很有可能进一步演变成为一个公司垄断了几乎所有的web搜索为其谋取商业利益.这显然不利于广大Internet用户. Nutch为我们提供了这样一个...
2012-11-11 22:20:00
175
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人