
信息搜索
文章平均质量分 64
kofsky
Welcome
展开
-
字节流读应对应字节流写
要求:从网页上读取数据,然后写入本地文件。 这段代码是通过一个url地址读取网页中的文本数据。没有写入文件,直接返回文本字符串。public static String getPageContent(String url) ...{ String content = ""; HttpWebRequest requ原创 2007-08-29 21:22:00 · 1063 阅读 · 0 评论 -
爬虫的初步效果
目前只能爬一个网页上的指定资源。 从csdn首页上爬下的图片资源~~ 界面:原创 2007-08-30 14:11:00 · 963 阅读 · 0 评论 -
垂直搜索网站~
垂直搜索网站一栏表分类信息搜索: 爬狗网(www.pagou.com) 优越网(http://www.yooye.com) 搜店( http://www.sostore.cn/)工作信息搜索: 职友集(http://www.jobui.com) 职通车(http://www.01hr.com/so/)转载 2007-11-02 22:51:00 · 1419 阅读 · 1 评论 -
不确定有穷自动机 NFA 与 隐马尔可夫模型 HMM 比较
不确定有穷自动机 NFA 定义为一个五元组如下:比如说下面的NFA:其状态转移图如下:∑*上的符号串t被NFA M接受也可以这样理解对于Σ﹡中的任何一个串t,若存在一条从某一初态节点到某一终态节点的道路,且这条道路上所有弧的标记依序连接成的串(不理采那些标记为ε的弧)等于t,则称t可为NFA M所识别(读出或接受)。若M的某些节点既是初态节点又是终态节点,或者存在一条从某个初态节点到某个终原创 2007-11-23 17:40:00 · 1654 阅读 · 1 评论 -
网页提纯
有时候发现自己兴趣挺广的,编程,设计,图像处理视频分析,模式识别,文本分析之类,都有点兴趣。看这篇文章 http://blog.youkuaiyun.com/lanphaday/archive/2007/08/13/1741185.aspx, 这个想法确实不错:使用文本和HTML代码的密度来决定一行文件是否应该输出,如果选取的内容是正文,那么其中的HTML标签肯定不高。挺有意思的,有时间可以试试这个想原创 2008-04-13 13:39:00 · 1101 阅读 · 1 评论 -
一个搜索问题的求解
这是一个模拟竞赛的题目中的一部分。大二下,或是大三上的时候做的,具体时间已经记得不太清楚了。期间提出的一个启发式算法极大的提高了一个搜索的效率,尤为有成就感。即使到现在,在算法方面,也很少有这种拉风的感觉。贴过来,体验一下这种拉风的感觉。嘿嘿。(这个竞赛是和老典和YB一起做的,里面自然有许多许多他们的劳动成果,呵呵,非常的感谢他们,说真的,合作非常的愉快,让我到今天都还记得这种纯粹的快乐原创 2008-05-06 15:24:00 · 1239 阅读 · 2 评论 -
字符串匹配算法
字符串匹配定义:文本是一个长度为n的数组T[1…n], 模式是以个长度mP和T的元素都是有限字母表∑中的字符1.字符串朴素匹配也就是蛮力匹配,每次移动一个步长,然后匹配,时间复杂度O((n-m+1)m)2.Rabin-Karp算法Rabin-Karp算法的思想是将模式串P表达为一个值,这样每次进行串匹配的时候,只需要比较这个值就可以了,而不需要对m个字符串进行m次比较。核心思想是用 一个值原创 2008-08-28 16:20:00 · 7042 阅读 · 0 评论