全文搜索Proxy

对于一些网站, 要建立全文查询, 比如资料, 文档的查询. 自己写查询很麻烦,毕竟不是
所有人都有写带相关度索引查询的功力.

比较好的是,Google和Baidu提供了桌面搜索,但是比较遗憾的是,只能于本地访问.而且自
己写的网站突然弹出一个Google或Baidu的界面还是比较诡异的, 这就变成一个问题, 如
何使用一个ip限制的网页呢?

当然就是代理,不过这个代理有点奇怪, 他不仅要转发请求和相应,还要改变相应的格式
. 对于改变一个Http页面的结构, 我在以前大概说过,就是使用JTidy或者其他的格式化
工具将html结构转化为良构的XML, 之后的事情对于一个对XML有了解的程序员那就是随
心所欲, 如鱼得水了.

不过,Baidu的新版搜索提供了一个接口, 返回XML格式的结果, 这就没什么可担心的了,
经过实验,功能基本正常, 只是在搜索结果为空时, Baidu的搜索会出现错误, 返回一个
HTML页面, 需要进行判断.

如何把XML结果显示出来, XSLT了. 不过要考虑到当你搜索到650个结果时如何显示的问
题,他每次通过指定start来显示10个, 要自己想一想, 写循环, 这里面用到一个技巧, 
就是使用递归来实现循环.

Baidu的立意就是提供给第三方进行调用,但是并没有对版权进行说明, 自己实验尚可, 
但是如果是其他的, 最好发信询问一下相关事宜.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值