Paip.论语义分析与语义搜索技术.attilax(艾龙)总结

语义搜索技术解析
本文介绍了语义搜索技术的基本概念及其工作原理,探讨了知识库的重要性,并解释了如何利用潜在语义索引等方法提高搜索质量。此外,还讨论了个性化搜索及方言拼音搜索的应用。
部署运行你感兴趣的模型镜像

Paip.论语义分析与语义搜索技术.attilax(艾龙)总结

 

1.    语义分析语义搜索定义... 1

2.    知识库(领域术语)在作用... 1

3.    关联搜索,相关词... 2

4.    属性和实体的相互关系... 2

5.    同义词关联搜索... 2

6.    Tabs(标签)关联搜索... 2

7.    潜在语义索引... 2

8.    范围搜索... 3

9.    个性化搜索... 3

10.      行为分析... 3

11.      方言拼音搜索... 3

 

作者Attilax 艾龙,  EMAIL:1466519819@qq.com 
来源:attilax的专栏
地址:http://blog.youkuaiyun.com/attilax

1.  语义分析语义搜索定义

顾名思义,所谓语义搜索[1],是指搜索引擎的工作不再拘泥于用户所输入请求语句的字面本身,而是透过现象看本质,准确地捕捉到用户所输入语句后面的真正意图,并以此来进行搜索,从而更准确地向用户返回最符合其需求的搜索结果

 

语义网的基础是一种新型搜索技术,通过这一技术,用户只需使用日常语言输入问题,就可以获得想要的答案。下一代搜索引擎的开发者认为,他们的技术能理解用户所使用的语言,在这方面远远强于谷歌的技术。新型搜索引擎随后遍历一个覆盖所有互联网内容的数据库,以寻找匹配度最高的内容。通过这一方式,它们可以针对用户提出的问题,例如谁是全球最好的石油公司,或者女性最喜欢哪部电影,给出最准确的答案。

语义搜索实质自然语言处理技术

 

搜索电脑,排在前面的网页有可能出现一篇只提到计算机却没提到电脑。因为搜索引擎通过语义分析知道这两个词是紧密相关的。

2.   知识库(领域术语)在作用

知识库是语义搜索引擎进行推理和知识积累的基础和关键,而Ontology则是知识库的基础

Ontology知识库的建立提供一个基本的结构;

Ontology提供一套概念和术语来描述某一领域,并且获取该领域的本质的概念结构;

知识库就运用这些术语去表达现实或者虚拟世界中的正确知识。

因此,建设一个知识库的第一步就是对该领域进行有效的Ontology分析。通过本体支持语义,支持人机之间的交流,从而实现机器智能,为web的发展带来了新的契机。而本体在搜索引擎中的应用,必将对搜索引擎的易用性和效率,产生极大的改进,从而使得web用户能够更好的在浩如烟海的信息海洋中遨游

 

3.  关联搜索,相关词

Concepts),比如,搜索iPhone,搜索结果中将会显示iPhone的具体参数和属性。搜索电影名称也会得到影片有关信息——包括预告片、评论、摘录。搜索城市名字会得到该城市相关相信——包括当地特色、活动、天气或酒店信息。

 

当两个词或一组词大量出现在同一个文档中时,这些词之间就可以被认为是语义相关。

潜在语义索引并不依赖于语言,所以SEO和搜索引擎优化虽然一个是英语,一个是中文,但这两个词大量出现在相同的网页中,虽然搜索引擎还不能知道搜索引擎优化或SEO指的是什么,但是却可以从语义上把”SEO”搜索引擎优化”search engine optimization””SEM”等词紧紧的连在一起。

 

 

4.  属性和实体的相互关系

搜索词本身,进入由各种实体(entities)、实体的属性和实体的相互关系所组成的世界

5.   同义词关联搜索

6. Tabs(标签)关联搜索

7.  潜在语义索引

语义搜索的关键之一在于怎样通过海量文献找出词汇之间的关系。目前的解决方案是,当词或词组大量出现在同一个文档中时,这些词之间就可以被认为是语义相关,这种方式被称为。潜在语义索引并不依赖于语言,如SEO和搜索引擎优化,虽然一个是英语,一个是中文,但这两个词大量出现在相同的网页中,搜索引擎不知道SEO和搜索引擎优化分别指的是什么,但是可以从语义上把SEO、搜索引擎优化、search engine optimization、SEM等词和词组联系在一起

原文出自【比特网】,转载请保留原文链接:http://network.chinabyte.com/457/11564457.shtml

8.   范围搜索

9.  个性化搜索

10.         行为分析

11.         方言拼音搜索

 

您可能感兴趣的与本文相关的镜像

Python3.10

Python3.10

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

### PAIP编程珠玑中的示例代码解释 PAIP(Paradigms of Artificial Intelligence Programming)是一本深入探讨人工智能编程范式的书籍,其中包含了大量 Lisp 编写的程序实例。这些例子不仅展示了如何实现特定的人工智能算法,还提供了关于良好软件工程实践的重要见解。 #### 示例:通用求解器框架 书中介绍了一个名为 `defun` 的宏来定义函数,在构建通用问题解决器时非常有用[^1]: ```lisp (defun solve (problem) "Find a solution to the given problem." (let ((solution nil)) ;; Attempt to find a solution using backtracking. (labels ((try-next-option () (when (not solution) (if (no-more-options-p ()) (return-from try-next-option nil) (let* ((option (next-option))) (cond ((goal-reached-p option) (setf solution option)) (t (push-state option) (solve problem) (pop-state)))))))) (try-next-option) solution))) ``` 这段代码实现了回溯法解决问题的一般模式。通过递归调用自身并尝试不同的选项直到找到解决方案为止。如果当前路径无法通向目标,则会恢复之前的状态继续探索其他可能性。 此方法能够有效地处理许多复杂的组合优化类问题,并且由于其灵活性可以很容易地适应各种具体应用场景下的需求变化。 #### 示例:自然语言理解模块 另一个重要的部分涉及到了自然语言处理技术的应用案例——基于语法分析树结构来进行语义解析: ```lisp (defun parse-sentence (sentence) "Parse SENTENCE into its constituent parts and build an interpretation tree." (multiple-value-bind (subject verb-object) (split sentence 'verb) `(sentence :subject ,(parse-noun-phrase subject) :action ,verb-object))) (defun parse-noun-phrase (np-string) "Interpret NP-STRING as either a simple noun or compound phrase." ...) ``` 上述片段演示了如何将输入字符串分割成主谓宾成分,并进一步解析名词短语的具体含义。这种层次化的表示方式有助于后续更高级别的推理操作以及对话管理等功能的设计实现。 #### 示例:专家系统规则引擎 最后值得一提的是书中对于专家系统的讨论,特别是有关于事实库管理匹配机制的部分: ```lisp (defstruct fact id pattern bindings) (defun match-patterns (pattern facts) "Return all FACTS that unify with PATTERN, along with their BINDINGS." ...) (defun add-fact (kb new-fact) "Add NEW-FACT to knowledge base KB after checking consistency against existing rules." ...) ``` 这里展示了一种简单而有效的知识表达形式及其相应的查询接口设计思路。通过对模式进行统一化计算从而快速定位符合条件的事实条目;而在更新数据库前则需确保新加入的信息不会引起逻辑矛盾等问题的发生。 以上仅是从《Programming Pearls》一书摘取的一些精彩片段,实际上该著作涵盖了更为广泛的内容领域技术细节等待读者去发掘学习。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值