专利分析[用于确定文档的含义以使文档和内容匹配的方法和系统]

最新推荐文章于 2025-12-19 09:06:48 发布

原创最新推荐文章于 2025-12-19 09:06:48 发布 · 1.6k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#文档 #c #数据库 #html #扩展 #存储

搜索引擎专栏收录该内容

69 篇文章

订阅专栏

本文介绍了一种文档分析技术，通过对文档进行分段并提取各段落的主题意义，来确定整个文档的核心内容。这种方法有助于精准定位文档的主旨，并能有效应用于去除无关内容如广告等，从而提高文档分析的准确性。

首先该专利表述了这么以下几个基本含义

1)一个文档,特别是有一定篇幅的文档,在每个自然段中包含至少一个特定的含义,这个和人的写作习惯,说话方式有关,或者说是局部性原理,就是提出一个话题后,会紧接着论述这个话题,而不会左右环顾而言它.而某些html页面由于追加的广告，这种分段分析的方法可以有效地去除不相关的概念，避免干扰。

2)为了提取文档的含义,通常需要了解文档每个自然段的含义,通过每个自然段的含义,寻找最相关的一组，并形成一个概念,而这个概念就是整篇文档所要描述的意思。

首先在含义数据库上的描述是不彻底的,不全面的,称之为方法和系统我认为是有问题的.如何有效地归类和存储并不是专利的重点.如何更好的扩展系统也不全面,权力要求书中,仅仅提到了关键词,链接,广告,等几个有价值的待匹配项目.

一句话,这种将文档分段分析,以及用来提供广告，或者链接的展示的，这种内容和资源匹配,是该专利的主要重点.

英文专利连接

http://v3.espacenet.com/textdoc?DB=EPODOC&IDX=EP1649396&F=0

中文专利链接

http://search.sipo.gov.cn/sipo/zljs/hyjs-yx-new.jsp?recid=CN200480021922.5&leixin=fmzl&title=%D3%C3%D3%DA%C8%B7%B6%A8%CE%C4%B5%B5%B5%C4%BA%AC%D2%E5%D2%D4%CA%B9%CE%C4%B5%B5%D3%EB%C4%DA%C8%DD%C6%A5%C5%E4%B5%C4%B7%BD%B7%A8%BA%CD%CF%B5%CD%B3&ipc=G06F17/30(2006.01)I

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。