- 博客(18)
- 资源 (10)
- 收藏
- 关注
原创 让Jena帮我们想
让Jena帮我们想----wuhui 谈到互联网的未来,人们自然的想到了语义网,虽然这个概念早在1999年就被伯纳斯-李先生提出,随后被学术界吵得沸沸扬扬,但是,真正基于语义网的应用似乎还处于孵化期。本文当然不想去解释什么是语义网、语义网的体系架构等等知识,本文将结合一个具体应用来说说语义网的一些特性,并由此希望能引起大家对语义网研究的兴趣和信心。 首先,我们来讲
2008-02-16 08:47:00
3638
原创 用c++实现urlencode
用C++来实现UrlEncode----wuhui 在php里面实现urlencode是异常简单的事情,但是,想在c++中实现这个功能,可能得自己开发了。 基于这个需要,我在网上逛了一趟,找到了一个比较好的实现,并封装成一个小工具,大家以后就方便了。 #ifn
2008-02-16 08:45:00
6312
原创 潜在语义索引(LSI)相关公式推导
LSI中SVD的相关公式推导SVD的公式为(公式0)其中,U、V为正交矩阵,即 , ,S为对角矩阵,即 。利用矩阵计算法则,对上式进行分析得到 (公式1)经过svdlibc的计算,即可得到 、 和 ,利用上述三个矩阵我们来进行相关的计算。如果 为 ,则上式可理解为:N: 文本对于特征的原始向量空间V: 文本降维后的数据空间,V的每一行为一个文本
2007-09-09 10:16:00
1592
原创 Mysql操作优化
项目中常常会用到数据库,插入和查询是经常用到的操作,为了提高其效率,有很多地方是可以改进的,下面列举几个加以介绍。1. 批量数据的插入这样的操作一般是用Mysql的C接口来操作,一般逻辑是得到一条记录的内容,然后插入到数据库。这种逻辑会使得操作比较慢,就其原因有几个:1. 插入过程中要建索引2. 通过Sql插入数据
2007-08-06 13:25:00
918
原创 Linux上安装Mysql4.1.22及ERROR2002问题
Linux上安装Mysql4.1.22及ERROR2002问题1. 获取源码:http://dev.mysql.com/get/Downloads/MySQL-4.1/mysql-4.1.22.tar.gz/from/pick,注意:文件名是“mysql-4.1.22.tar.gz”。2. 解压:tar xvzf mysql-4.1.22.tar.gz
2007-07-21 00:37:00
2081
原创 Linux C++ 面向对象多线程编程实例之“生产者-消费者”
Linux C++ 面向对象多线程编程实例之“生产者-消费者”问题1:生产者-消费者模型解决方案:两个线程,一个共享变量。源码: #include #include using namespace std;
2007-07-13 20:40:00
5003
原创 我看搜索引擎!
我看搜索引擎---------wuhui803@gmail.com从第一次接触搜索引擎到现在应该有几年历史了,从事其相关领域的开发也有一些时间了,总想写点什么来表针对自己经历的一个总结,本文算是一个开始吧。本文将重点讲解一下我对搜索引擎发展的理解。 现在大家都炒搜索引擎,为什么?因为能赚钱,因为眼红Google。每天,当我用搜索引擎的时候,我在想一个问题,难道这就是我们查找
2007-07-03 10:22:00
1047
原创 WordMap
WordMap介绍----wuhui803@gmail.com 在解释这个概念之前,我们来分析一下一种现象。 众所周知,词语是最小的语义单位,想理解语言本身不能不研究词语,这也难怪现在的语言学研究都从分词开始。词语和词语之间也是有联系的,看到“刘翔”和“冠军”你会想到什么?那么“马云”和“雅虎”呢?无需置疑,词语之间是有关系的。人掌握这种关系是通过“听”和“看”
2007-07-03 10:15:00
3846
原创 关于搜索引擎的思考!
最近想整理一下关于搜索引擎以其相关东西的资料,总觉得应该好好的来整理一些东西.从爬虫到排序,从结构到算法,应该说搜索引擎是越发复杂了. Java开源搜索引擎列表 Java开源爬虫
2007-01-03 14:52:00
970
原创 用搜索引擎改变人们的生活!
人类的进步应该说是一步步踏着巨人肩膀前进的过程。自从网络出现后,人们的学习习惯在不断改变,从最开始的综合门户到现在的搜索引擎,我们查阅资源的方式在不断的改变着,信息获取的手段日益快捷,得到的信息量也在不断增加,可以毫不夸张的说,现在社会需要的是会查找资源和合理利用资源的人,因此,人的智商要求也越来越高,但是相反,搜索引擎却在不断的努力,让每个人都能平等的获取资源,让每个人都能从别人的经验中成长、收
2006-07-12 22:33:00
1734
原创 反网页垃圾研究现状
目前,反网页垃圾技术可谓是如火如荼啊,大家都在一股劲的想法子将自己的技术弄上去,研究的热点也集中人工智能和知识工程领域。人工智能干什么呢?很简单,就是想让机器来学习,让他们能自主积累知识,发现Spam的特点,成为他们的老朋友,将其干掉 从某种角度讲,人工智能是一种理想化的东西,且不说我们如何引入人工智能,就是人工智能本身也并没有其名字那样聪明。于是,人们想到了知识工程,这个知识就是人将积累的东西整
2006-04-22 15:15:00
949
转载 Antispam,反垃圾,反作弊[转载]
Antispam,反垃圾,反作弊[原创]http://FullSearch.Com 中文全文检索网 2006-2-5 15:59:10 sigz 关键词:搜索引擎优化 反作弊 antispam
2006-04-19 21:49:00
3970
原创 网页垃圾简介
所谓网页垃圾,就是某些网站,利用搜索引擎的结果排序特点,采用一定的欺骗技术,使其在某些主题上具有较高的权重,当用户搜索这些主题时,这些网站将排在结果序列的前面.从某种角度讲,网页垃圾的出现是互联网发展的一个表现,它反映出互联网在更大的范围内为人们所了解和研究.对于网页垃圾的学术研究也开始逐步形成规模,在Web spam taxonomy一文中,作者Zolt´an Gy¨ongyi 和Hecto
2006-04-18 13:21:00
1235
原创 非常态心理学!
师弟这几天思维颇为活跃,每每谈话总能蹦出思想的火花!昨日餐桌上,大而特大的宣讲其独门秘笈“非常态心理学”。话题初始,跃进兄问到“敢问此‘非常态’和‘BT’有和区别”。师弟严肃说“非常态乃心理不正常之谓也,然未达BT之程度,此态介于常态和BT之间,有恢复常态之可能,亦有恶化成BT之possibility!”其间,吾一语未发。顿间,师弟对俺说“师兄,以吾之拙见,汝当研习一下非常态!”“此言甚是有理,虽
2005-03-22 22:21:00
1498
2
原创 树梢上的鸟儿啊,你到底有几只?
“树上有十只鸟,开枪打死一只,还剩几只?” n“问的是树上还剩几只么?” n“是无声手枪或别的无声的枪吗?” n“枪声有多大?” n“枪声震的耳朵聋或其他的伤害么?” n“在这个城市里打鸟犯不犯法?” n“您确定那只鸟真的被打死啦?” n“树上的鸟里有没有聋子?” n“有没有关在笼子里的?” n“边上还有没有其他的树,树上还有没有其他鸟?” n“有没有残疾的或饿的飞不动的鸟?” n“算不算怀孕
2005-03-22 22:07:00
1178
原创 语义距离的经典文章:Fuzzy Semantic Distance Measures between Ontological Concepts!
Paper: Fuzzy Semantic Distance Measures between Ontological ConceptsProfileFrom: IEEE 2004Author: Valerie CrossE-mail:crossv@mouhio.eduIdea AbstractNotes:: Similarity between concepts: Distance betwee
2005-03-16 15:34:00
2129
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人