- 博客(128)
- 资源 (10)
- 收藏
- 关注

转载 浅谈.NET下的多线程和并行计算系列文章索引[转]
浅谈.NET下的多线程和并行计算系列文章索引 浅谈.NET下的多线程和并行计算(一)前言 浅谈.NET下的多线程和并行计算(二)线程基本知识 浅谈.NET下的多线程和并行计算(三)线程同步基础上 浅谈.NET下的多线程和并行计算(四)线程同步基础下 浅谈.NET下的多线程和并行计算(五)线程池基础上 浅谈.NET下的多线程和并行计算(六)线程
2011-03-18 16:05:00
867

原创 TreeView 树的查找/遍历
最近几个项目用到 TreeView控件,遍历/查找 TreeView树节点使用较多。每次都写,多有不便,干脆写个相关的类,以后用就方便了。 TreeView 遍历可分为“递归”和“非递归”两种。递归的简单,但是效率低,占内存也多。非递归的麻烦些,但效率高些。递归: /// ///递归查找某节点下指定显示文本的树节点。 /// ///父节点 ///查找的显示文本 /// publicstatic
2010-10-29 12:54:00
1229

转载 3 Awesome Free Math Programs
http://math-blog.com/2007/06/02/3-awesome-free-math-programs/Mathematical software can be very expensive. Programs like Mathematica, Maple and Matlab are incredibly powerful, flexible and usually well documented and supported. Their price tags however are
2010-09-19 08:39:00
556
原创 单例应用程序的实现
一些程序需要单实例运行,这里简单介绍下单实例的实现及相关问题。首先定义单实例指的是整个操作系统中只运行一个应用程序的实例。当用户运行应用程序时先检查系统是否已经启动该应用程序,若启动则将自动弹出应用程序窗体,否则启动应用程序。OK,这样单实例应用程序的基本功能就出来了。我们分别进行讨论。一、如何检测系统中是否已经启动该应用程序?1.使用线程互斥体Mutex当两个或更多线程需要同时访
2011-12-02 19:04:59
1771
转载 .net中比较两幅图片是否相同
.net中的GDI+能非常方便的进行图象处理,但是并未直接提供进行图片比较的类或者方法,本文的目的是探讨如何进行图片比较。 首先要说明的是,进行比较的两幅图片必须具有相同的格式,并且最好是未经压缩的图片格式。否则,不能进行完全的相同性对比,只能做近似判断,比如各种颜色分量相
2011-07-28 16:03:18
937
转载 随机抽样一致性算法(RANSAC)
作者:王先荣 本文翻译自维基百科,英文原文地址是:http://en.wikipedia.org/wiki/ransac,如果您英语不错,建议您直接查看原文。 RANSAC是“RANdom SAmple Consensus(随机抽样一致)”的缩写。它可以从一组包含“局
2011-07-28 15:59:27
673
转载 确保真正的线程安全——微软为什么不提供线程安全库
线程安全在高并发情况下是一个非常严重的问题。以下代码在多线程访问时,会出现问题。我们以List.Add为例,来说明在多线程访问下的状况。以下代码是List.Add的实现。public void Add(T item){ if (this._size == this._items.Length) this.EnsureCapacity(this._size + 1); t
2011-07-28 12:28:37
474
转载 如何写健壮的代码
不管是在面向过程时代,还是在面向对象时代,任何一个功能都是由若干函数协作来实现的。一个函数由输入、处理和输出组成。实现这个函数的代码段都假定了输入的参数已经满足了若干规则,在执行这个函数时,函数的代码会拿到输入的参数然后执行代理逻辑。下面我们就来看一个函数的代码。 1 priv
2011-07-28 12:18:01
554
转载 c#不可忍受之慢—谁是罪魁祸首
前些日子,爆出N篇说c#/.net太慢的,要求删除c#/.net部分特性的文章。 撇开那些文章不说,c#/.net慢似乎是业界公认的铁则,不论大家如何证明c#/.net其实不比c++慢多少,但是应用程序级别的性能却依然这么慢。 那么c#/.net慢在哪里? 很不
2011-07-28 11:59:31
488
转载 C#常用开源项目
net PDF 类库 PDFsharp PDFsharp是一款可以让.NET框架支持的任何语言很容易的创建PDF文件的类库。ASP.NET FO PDF FO PDF 是一款C#编写类似于ASP.NET服务器控件的控件。它接受DataTable 和一些其
2011-07-28 10:22:44
968
转载 你必须懂的.NET中Attribute
作为一个.NET开发人员,懂Attribute的重要性,用.NET大师Jeffrey Richter的话就是“任何.NET Framework 开发人员都有必要对定制attribute有一个牢靠的掌握”,所以掌握Attitude,这是必须的! 什么是Attribute(特性)
2011-07-28 10:12:05
637
原创 欧几里德算法及其扩展算法
一、欧几里德算法1、欧几里德算法概述: 欧几里德算法又称辗转相除法,用于计算两个整数a,b的最大公约数。其计算原理依赖于下面的定理: gcd函数就是用来求(a,b)的最大公约数的。 gcd函数的基本性质: gcd(a,b)=gcd(b,a)=gcd(-a,b)=gc
2011-07-26 15:38:58
1998
转载 几种经典的Hash算法实现
哈希算法将任意长度的二进制值映射为固定长度的较小二进制值,这个小的二进制值称为哈希值。哈希值是一段数据唯一且极其紧凑的数值表示形式。如果散列一段明文而且哪怕只更改该段落的一个字母,随后的哈希都将产生不同的值。要找到散列为同一个值的两个不同的输入,在计算上是不可能的,所以数据的哈希
2011-07-26 14:37:21
805
原创 AutoResetEvent和ManualResetEvent 线程同步
在.Net多线程编程中,AutoResetEvent和ManualResetEvent这两个类经常用到, 他们的用法很类似,但也有区别。ManualResetEvent和AutoResetEvent都可以通知一个或多个正在等待的线程已发生事件,在线程间进行同步时使用,它们都继承自EventWaitHandle。Set方法将信号置为发送状态,Reset方法将信号置为不发送状态,WaitOne等待信号
2011-06-30 16:35:00
602
转载 C/C++中的函数调用约定
在C语言中,假设我们有这样的一个函数: int function(int a,int b) 调用时只要用result = function(1,2)这样的方式就可以使用这个函数。但是,当高级语言被编译成计算机可以识别的机器码时,有一个问题就凸现出来:在CPU中,计算机没有办法知道一个函数调用需要多少个、什么样的参数,也没有硬件可以保存这些参数。也就是说,计算机不知道怎么给这
2011-06-26 15:22:00
818
1
翻译 Conditional Random Fields(CRF)
<br /><br />原文:http://www.inference.phy.cam.ac.uk/hmw26/crf/<br />写的不错,有空翻译过来。<br /><br />This page contains material on, or relating to, conditional randomfields. I shall continue to update this page as research onconditional random fields advances, s
2011-05-23 16:39:00
2526
转载 Mongodb源码分析--Command体系架构
<br />Command在Mongodb中是一类特殊操作,它提供了强大的管理及各项操作(比如建库,索引,删除集合等)。可以说通过Command可以完成几乎 所有想做的事情。同时Mongodb开发者在Command上又做了非常清晰体系架构和设计,便于管理和高效执行各种类型的Command。<br /> 今天就专门用一篇篇幅来着重介绍一下其Command的体系架构,并用例子来介绍mongod是如何将Command引入其中的。<br /> <br /> 为了对其中大部分command对一个大
2011-05-19 09:29:00
734
转载 Mongodb源码分析--内存文件映射(MMAP)
<br />在Mongodb中,其使用了操作系统底层提供的内存映射机制,即MMAP。MMAP可以把磁盘文件的一部分或全部内容直接映射到内存,这样文件中的信息 位置就会在内存中有对应的地址空间,这时对文件的读写可以直接用指针来做,而不需要read/write函数了。同时操作系统会将数据刷新保存到磁盘上。 如下图:<br /> <br /> 鉴于linux,window系统为mmap所提供的API大同小异(见下图)。这里仅以mongodb对window系统的mmap调用机制为例,来说 明一下
2011-05-19 09:27:00
819
转载 Mongodb源码分析--游标Cursor
<br /><br /> 在Mongodb中,其提供了类似关系型数据中cursor对象来遍历数据集合,同时mongodb并要根据不同的场景生成不同的游标对象 (cursor),比如顺序遍历游标(basicCursor),反向游标(reverseCursor), B树索引游标(btreeCursor)等。 下面是其游标体系架构类图(位于cursor.cpp, cursor.h, clientcursor.cpp, clientcursor.h):<br /> <br /> 从该图中,可以看到
2011-05-19 09:00:00
623
转载 Mongodb源码分析--更新记录
<br /> 在之前的一篇文章 中,介绍了assembleResponse函数(位于instance.cpp第224行),它会根据op操作枚举类型来调用相应的crud操作,枚举类型定义如下:<br /> view plaincopy to clipboardprint?enum Operations { opReply = 1 , /* reply. responseTo is set. */ dbMsg = 1000 , /* generic
2011-05-19 08:28:00
701
转载 Mongodb源码分析--更新记录
<br /> 在之前的一篇文章 中,介绍了assembleResponse函数(位于instance.cpp第224行),它会根据op操作枚举类型来调用相应的crud操作,枚举类型定义如下:<br /> view plaincopy to clipboardprint?enum Operations { opReply = 1 , /* reply. responseTo is set. */ dbMsg = 1000 , /* generic
2011-05-19 08:27:00
660
转载 Mongodb源码分析--删除记录
<br /><br />在之前的一篇文章 中,介绍了assembleResponse函数(位于instance.cpp第224行),它会根据op操作枚举类型来调用相应的crud操作,枚举类型定义如下: view plaincopy to clipboardprint?enum Operations { opReply = 1, /* reply. responseTo is set. */ dbMsg = 1000, /* generic msg com
2011-05-19 08:26:00
872
转载 Mongodb源码分析--消息(message)
<br />在Mongodb中,客户端和服务端进行通信是基于mongodb wire protocol 。说白了,该协议是一个简单的基于socket,请求/响应方式的协议,客户端使用常规的TCP/IP套接字(socket)进行通信。<br /><br /> 客户端与服务端使用约定的消息(格式)进行通信,其消息头结构与C语言中的struct类似。具体的代码(位于message.cpp):<br /> <br /> view plaincopy to clipboardprint?stru
2011-05-19 08:25:00
579
转载 Mongodb源码分析--插入记录及索引B树构建
<br /><br />在之前的一篇文章 中,介绍了assembleResponse函数(位于instance.cpp第224行),它会根据op操作枚举类型来调用相应的crud操作,枚举类型定义如下: enum Operations {<br /> opReply = 1 , /* reply. responseTo is set. */ <br /> dbMsg = 1000 , /* generic msg command fo
2011-05-19 08:23:00
661
转载 N-gram模型
N-Gram是大词汇连续语音识别中常用的一种语言模型,对中文而言,我们称之为汉语语言模型(CLM, Chinese Language Model)。汉语语言模型利用上下文中相邻词间的搭配信息,在需要把连续无空格的拼音、笔划,或代表字母或笔划的数字,转换成汉字串(即句子)时,可以计算出具有最大概率的句子,从而实现到汉字的自动转换,无需用户手动选择,避开了许多汉字对应一个相同的拼音(或笔划串,或数字串)的重码问题。 该模型基于这样一种假设,第n个词的出现只与前面N-1个词相关,而与其它任何词都不相关,整句的
2011-05-19 08:12:00
1551
转载 ME, HMM, MEMM, CRF
<br />最大熵模型 Maximum Entropy<br />现从一个简单例子看起:<br />比如华盛顿和维吉利亚都可以作人名和地名,而从语料中只知道p(人名)=0.6,那么p(华盛顿=人名)的概率为多少比较好呢?一个直观的想法就是p(华盛顿=人名)=0.3。为什么呢?这就是在满足已有证据的情况下不做任何其他假设,也就是熵最大,这就是最大熵模型的原理。<br />现在来看模型的定义:<br />首先,明确模型的目标:给定一个上下文x,估计p(y|x)<br />接着,从训练样本中我们可以得到一串标注过
2011-05-18 18:01:00
1003
转载 隐马尔科夫模型HMM学习(三)
找到可能性最大的隐含状态序列崔晓源 翻译多数情况下,我们都希望能够根据一个给定的HMM模型,根据观察状态序列找到产生这一序列的潜在的隐含状态序列。1、穷举搜索方法我们可以通过穷举的方式列出所有可能隐含状态序列,并算出每一种隐状态序列组合对应的观察状态序列的概率。概率最大的那个组合对应的就是最可能的隐状态序列组合。Pr(observed sequence | hidden state combination).比如说上图中的trellis中,最有可能的隐状态序列是使得概率:Pr(dry,damp,soggy
2011-05-18 18:00:00
707
转载 隐马尔科夫模型HMM学习(一)
介绍崔晓源 翻译我们通常都习惯寻找一个事物在一段时间里的变化规律。在很多领域我们都希望找到这个规律,比如计算机中的指令顺序,句子中的词顺序和语音中的词顺序等等。一个最适用的例子就是天气的预测。首先,本文会介绍声称概率模式的系统,用来预测天气的变化然后,我们会分析这样一个系统,我们希望预测的状态是隐藏在表象之后的,并不是我们观察到的现象。比如,我们会根据观察到的植物海藻的表象来预测天气的状态变化。最后,我们会利用已经建立的模型解决一些实际的问题,比如根据一些列海藻的观察记录,分析出这几天的天气状态。Gener
2011-05-18 17:57:00
1623
转载 基于隐马尔科夫模型的中文分词研究
<br />基于隐马尔科夫模型的中文分词研究<br /> 魏晓宁<br /> (南通大学计算机科学与技术学院,江苏南通226019)<br />摘要:一直以来,汉语自动分词是公认的汉语信息处理瓶颈。反思现有汉语自动分词技术,发现均有隐舍两大假设:语言是规律的、词具有
2011-05-18 17:56:00
2367
转载 最大熵模型:读书笔记
<br /><br />最大熵模型:读书笔记<br /> <br /> 胡江堂,北京大学软件学院<br />1. 物理学的熵<br />2. 信息论的熵<br />3. 熵和主观概率(一个简单注释<br />4. 熵的性质<br />4.1. 当所有概率相等时,熵取得最大值<br />4.2. 小概率事件发生时携带的信息量比大概率事件发生时携带的信息量多<br />
2011-05-18 17:55:00
894
转载 最大熵模型文献阅读指南
<br />最大熵模型(Maximum Entropy Model)是一种机器学习方法,在自然语言处理的许多领域(如词性标注、中文分词、句子边界识别、浅层句法分析及文本分类等)都有比较好的应用效果。张乐博士的最大熵模型工具包manual里有“Further Reading”,写得不错,就放到这里作为最大熵模型文献阅读指南了。<br /> 与《统计机器翻译文献阅读指南》不同,由于自己也正在努力学习Maximum Entropy Model中,没啥发言权,就不多说废话了。这些文献在Google上很容易找到,不
2011-05-18 17:53:00
533
转载 基于CRF的中文分词
CRF简介Conditional Random Field:条件随机场,一种机器学习技术(模型)CRF由John Lafferty最早用于NLP技术领域,其在NLP技术领域中主要用于文本标注,并有多种应用场景,例如:•分词(标注字的词位信息,由字构词)•词性标注(标注分词的词性,例如:名词,动词,助词)•命名实体识别(识别人名,地名,机构名,商品名等具有一定内在规律的实体名词)本文主要描述如何使用CRF技术来进行中文分词。CRF VS 词典统计分词•基于词典的分词过度依赖词典和规则库,因此对于歧义词和未登录
2011-05-18 17:43:00
541
转载 当前几个主要的Lucene中文分词器的比较
<br />1. 基本介绍:<br />paoding :Lucene中文分词“庖丁解牛” Paoding Analysis<br />imdict :imdict智能词典所采用的智能中文分词程序<br />mmseg4j : 用 Chih-Hao Tsai 的 MMSeg 算法 实现的中文分词器<br />ik :采用了特有的“正向迭代最细粒度切分算法“,多子处理器分析模式<br />2. 开发者及开发活跃度:<br />paoding :qieqie.wang, google code 上最后一次代码提
2011-05-18 17:17:00
476
转载 搜索引擎技术揭密:中文分词技术
<br />信息的飞速增长,使搜索引擎成为人们查找信息的首选工具,Google、百度、中国搜索等大型搜索引擎一直是人们讨论的话题。随着搜索市场价值的不断增加,越来越多的公司开发出自己的搜索引擎,阿里巴巴的商机搜索、8848的购物搜索等也陆续面世,自然,搜索引擎技术也成为技术人员关注的热点。<br /> 搜索引擎技术的研究,国外比中国要早近十年,从最早的Archie,到后来的Excite,以及altvista、overture、google等搜索引擎面世,搜索引擎发展至今,已经有十几年的历史,而国内开始研究
2011-05-18 17:11:00
468
转载 自动分词算法的分类
<br />我们可以将现有的分词算法分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。<br />1、 基于字符串匹配的分词方法<br />这种方法又叫做机械分词方法,它是按照一定的策略将待分析的汉字串与一个"充分大的"机器词典中的词条进行配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。<br />按照扫描方向的不同,串匹配分词方法可以分为正向匹配和逆向匹配;按照不同长度优先匹配的情况,可以分为最大(最长)匹配和最小(最短)匹配;按照是否与词性标注过程相结合,又可以分为
2011-05-18 17:08:00
951
转载 百度搜索引擎详解
<br /><br />今天无意中读到的,网上转载很多了,不过还是忍不住在转载一番,不过原文就找不到了,读得有点累,但是多少有点启发了,推荐一下。<br />查询处理以及分词技术<br />随 着搜索经济的崛起,人们开始越加关注全球各大搜索引擎的性能、技术和日流量。作为企业,会根据搜索引擎的知名度以及日流量来选择是否要投放广告等;作为 普通网民,会根据搜索引擎的性能和技术来选择自己喜欢的引擎查找资料;作为技术人员,会把有代表性的搜索引擎作为研究对象。搜索引擎经济的崛起,又一次向 人们证明了网络所蕴藏的巨大商
2011-05-18 16:41:00
1106
转载 中文分词和搜索引擎
<br />作者:Winter 工程师<br />搜索引擎,上网的人基本上都不陌生了,CNNIC的第17次《互联网调查报告》显示,使用搜索引擎服务的网民,仅次于电子邮件。中文分词,估计了解的人并不多,毕竟太技术,太底层。但中文分词是中文搜索引擎系统中非常重要的模块,这里之所以强调是中文搜索引擎,是针对英文搜索引擎来讲,因为对于英文来说,空格代表词和词之间的分隔,也就不存在分词问题。和中文搜索引擎类似还有日文、韩文、泰文搜索引擎等,都需要处理分词问题。<br />为什么需要中文分词<br />目前的搜索引擎,
2011-05-18 16:37:00
493
翻译 一个基于搜索的中文分词方法( A Search-based Chinese Word Segmentation Method)
<br />A Search-based Chinese Word Segmentation Method<br /> 一个基于搜索的中文分词方法<br /> <br />ABSTRACT<br /> In this paper, we propose a novel Chinese word segmentation method which leverages the huge d
2011-05-18 16:25:00
1115
转载 二值形态学——膨胀,腐蚀
<br />最近在做一个Motion Detection的课题,在课题中提取的运动物体往往由离散的点组成,如果要用连通分量的计算方法提取每个运动物体的轮廓不太容易,为此要将由离散点组成的图像进行膨胀,腐蚀运算。<br />膨胀 dilation<br />考虑两幅二值图像A,B。它们的前景用黑色,背景用白色。另fA和fB表示各自前景点的集合。定义膨胀运算为:dilation(A,B) = {a+b| a∈A,b∈B}。比如:<br />A = {(2,8),(3,6),(4,4),(5,6),(6,4),(
2011-05-18 16:06:00
1159
Programming C#中文版(第4版).part3
2011-07-27
DevComponents.DotNetBar v8.8.0.0.for.NET.part2.rar
2010-09-19
DevComponents.DotNetBar v8.8.0.0.for.NET.part1.rar
2010-09-19
(C#)ListViewEx--扩展 ListView
2009-11-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人