
算法
xywlzd
这个作者很懒,什么都没留下…
展开
-
UTF8编码转Unicode编码(C语言)
/*** 功能:UTF8编码转Unicode编码* 参数:dst 目标字符串,src 源字符串*/WORD UTF8_to_Unicode(BYTE *dst, BYTE *src){ WORD i = 0, unicode = 0, ii, iii; int codeLen = 0; while ( *src ) {转载 2012-09-28 10:06:11 · 1811 阅读 · 0 评论 -
Hash算法
Hash算法 Hash,一般翻译做“散列”,也有直接音译为“哈希”的,就是把任意长度的输入(又叫做预映射, pre-image),通过散列算法,变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,而不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。转载 2012-09-20 12:12:32 · 606 阅读 · 0 评论 -
Hash 算法及其应用
--------------- 什么是 Hash Hash 的重要特性 Hash 函数的实现 主要的 Hash 算法 Hash 算法的安全问题 Hash 算法的应用 结 论 --------------- Hash,一般翻译做“散列”,也有直接音译为"哈希"的,就是把任意长度的输入(又叫做预映射, pre-image),通过散列算法,变换成固定长度的输出,该转载 2012-09-20 12:18:51 · 402 阅读 · 0 评论 -
MD5
Message Digest Algorithm MD5(中文名为消息摘要算法第五版)为计算机安全领域广泛使用的一种散列函数,用以提供消息的完整性保护。该算法的文件号为RFC 1321(R.Rivest,MIT Laboratory for Computer Science and RSA Data Security Inc. April 1992)发展历史 MD5即Me转载 2012-09-20 15:34:30 · 2279 阅读 · 0 评论 -
Rabin-Karp算法
Rabin-Karp算法在字符串匹配中其实也不算是很常用,但它的实用性还是不错的,除非你的运气特别差,最坏情况下可能会需要O((n-m)*m)的运行时间(关于n,m的意义请看上篇)。平均情况下,还是比较好的。朴素的字符串匹配算法为什么慢? 因为它太健忘了,前一次匹配的信息其实可以有部分可以应用到后一次匹配中的,而朴素的字符串匹配算法只是简单的把这个信息扔掉,从头再来,因此,浪费了时间。好好的利转载 2012-09-19 12:05:03 · 624 阅读 · 0 评论 -
Winnowing算法
在介绍winnowing之前,我们先来了解一下有关copy-detection的知识。copy-detection主要用于检测文件或网页中相同的内容,判定是否存在拷贝、抄袭等行为以及程度。在下面的讨论中,我们将范围缩减到只考虑包含ASCII字符的文件,不考虑图片及视屏等内容。通常情况下,我们认为用于copy-detection的算法应该满足以下要求: 1、无视空白符(Whites转载 2012-09-19 10:37:46 · 8685 阅读 · 4 评论 -
文本分类入门
最近要做文本分类相关的课程project,因此上网找了一下文本分类的资料,下面这个感觉比较通俗易懂,收录在这里。来源 http://www.blogjava.net/zhenandaci/category/31868.html?Show=All文本分类入 门(一)文本分类问题的定义文本分类系列文章,从文本分类问题的定义开始,主要讲解文本分类系统的构成,主流的统计学习方法以及较为优秀的转载 2012-12-02 17:00:50 · 1096 阅读 · 0 评论