
搜索技术
newasoft
这个作者很懒,什么都没留下…
展开
-
全文搜索的数学问题
语句有长有短,可以hash来个统一的,一字以hash,顺序再hash,文字在语句的不同位置得到不同的hash,同样的文字排列hash值一样。我家的搜索以语句为单位,这点估计所有的语言都一样,简化为数学问题,解决小范围穷尽的数据问题即可。世界上的语言组成的语句在数学意义上事可以小范围穷尽的,而文字的组合排列问题则不可以。设计的人还不懂语文,不是什么什么都可以在一块的,字字也一样。原本一句话就明白的事,愣是拆成词,加载,查询在拼凑。关键词倒排序,就是不懂数学的人弄出来的。特别的语义分析,词之间的计算。原创 2022-09-20 03:43:14 · 125 阅读 · 0 评论 -
开启智能安全搜索之旅:密文全文搜索技术的研究开发和应用
密文全文搜索技术的研究开发和应用张留学[1] 张焕中[2]1. 引言信息技术的飞速发展,对信息的安全提出了很高的要求,如何实现信息安全,从信息的安全存储,安全传输到信息的安全检索,是云计算时代必须面临的挑战。虽然在全文检索技术和加密算法领域,已有很好的商业产品出现,但如何高效的检索这些加密的非结构化数据,还是一个亟待解决的难题。多语种和密文全文搜索系统,构建一种基于语义树的全文搜索系统,在此基础...原创 2018-04-11 00:58:40 · 2337 阅读 · 0 评论 -
利用casperjs+phantomjs获取网站文档
利用casperjs+phantomjs获取网站文档利用无界面浏览器,结合js脚本获取网站的文档链接,并下载文档,简单易行。本文从phantomjs的改造开始,给出了一个遍历网站链接,并下载文件格式为pdf、zip和rar的文件的实例。1、改造phantomjs利用phantomjs获取文件需要对其进行改造,具体改造如下:l 首先进入vs工具的命令行模式:vs原创 2018-01-17 13:25:30 · 783 阅读 · 1 评论 -
多语种全文搜索
多语种全文搜索产生背景全文检索是信息检索的核心业务,当前提供服务的系统均基于关键词的搜索技术,它无法和语义理解、语义处理相适应,无法满足语句文字之间上下文的要求。不同的语种需要不同的分词技术,这样不同语种搜索引擎的建立必然会消耗大量的人力和物力,能否实现不依靠分词技术为不同语种提供统一的搜索服务?基于关键词的搜索技术,无法满足语句文字之间上下文的要求,能否实现基于自然语句的搜索服务原创 2018-01-16 15:08:30 · 1679 阅读 · 1 评论 -
语义树索引技术
本文介绍文字语义树的索引技术。语言的基本为文字,由文字构成不同的语句,语句是文章或者人际交流最基本的语言单位。如果一句话为树的一个分支,那么相同起点的文字的语句结合在一起构成一颗语义树,树上的节点分为根节点,分支节点,果子节点(语句最后的节点,一般对应一篇文章,如果文章为果子的话,该节点为果子节点)。这样所有的语言组成不同的语义树,整个语义树表示现代的语言的语句的集合。本文介绍一种语义树的索引技术,通过该技术找到最大匹配的语句,从而得到果子,已找到匹配的文章。该技术可以用于全文索引、密文全文索引和NLP原创 2018-01-16 14:10:10 · 4685 阅读 · 2 评论 -
搜索人生之——衣食住行
衣食住行,我们能关注啥?除了关注,我们又能做些啥?原创 2017-04-26 11:43:08 · 807 阅读 · 0 评论 -
搜索人生——开心
“开心”经常和哪些在一起?搜搜后就知道原创 2017-04-24 22:35:49 · 904 阅读 · 0 评论 -
搜索人生之——遗憾
人们在搜索“遗憾”时,可知道“遗憾”后面都有些什么?能说出来的“遗憾”,能找得到的“遗憾”,是否还是“遗憾”?心魔在,总是遗憾。原创 2017-04-24 22:08:19 · 725 阅读 · 2 评论 -
搜索人生之五——13岁时我们有什么不一样
记忆是个好东西,想想自己13岁那年在想什么,做什么,一时真的不知道。13岁那年的问题,想的时候一开始就变成了数学问题,需要推导。那年我在读书,或者已经开始谋生。回忆不到多少细节了,小时候成了最好的一句话“我小的时候”。13岁初中了,13岁也许怀揣梦想:成为****,球星、明星,做特种兵。玩的方式有了一定的变化:手机、网络、山地车、跆拳道、钢琴、吉他等,不同的年代有所不同。当补习班成为一大特色的时候,很少看到这类的问题。问的还是一类老的问题,关注孩子的学习,是否还有之外的东西需要我们关注。我总在想:原创 2016-12-18 23:08:43 · 447 阅读 · 0 评论 -
搜索人生之四——12岁的花季
十二岁花季,展开了多姿多彩的一面。12岁的时候我们是否也这样想?有了网络、手机、聊天工具,要学武术、学音乐,锻炼身体@体育,......不说了,对比下图看看是否有我们的影子?好一个"好雨知时节",12岁!原创 2016-12-18 22:05:40 · 455 阅读 · 0 评论 -
搜索人生之三——11岁了
11岁的孩子会问什么?原创 2016-12-18 20:59:36 · 429 阅读 · 0 评论 -
搜索人生之一——我们小的时候(1到8岁)
人生是设计好的程式,一个棋局而已。通过网络搜索,看看我们留下了什么?关注什么?人生其实是搜索的人生,探索的人生。不同的时节有不同的方式原创 2016-12-15 12:57:27 · 1415 阅读 · 1 评论 -
语句索引和搜索
一般来说的全文搜索服务,大体是基于字和关键词的,基于语句的全文搜索服务是一个有意思的课题。以文字为最小节点,以语句为分枝,建立语义树,提供基于语义树的全文检索服务。通过对语句进行语义特征编码,并结合数据库,来实现基于语义树的全文索引和搜索服务。原创 2016-11-22 22:40:41 · 2223 阅读 · 2 评论