哈尔滨工业大学 计算机系 张红,面向TDT的动态多文档文摘研究-哈尔滨工业大学学报.PDF...

面向TDT的动态多文档文摘研究-哈尔滨工业大学学报

第42卷 第11期 哈 尔 滨 工 业 大 学 学 报 Vol42 No11

2010年11月 JOURNALOFHARBININSTITUTEOFTECHNOLOGY Nov.2010

面向TDT的动态多文档文摘研究

1,2 1 1 1

刘美玲 ,赵铁军 ,郑德权 ,于 洋

(1.哈尔滨工业大学 计算机科学与技术学院,哈尔滨 150001,mlliu@mtlab.hit.edu.cn;

2.东北林业大学 信息与计算机工程学院,哈尔滨150040)

摘 要:应用话题检测技术中的聚类思想,分析了动态多文档文摘时间特性.利用时间信息的阈值变化得到

不同的多文档聚类结果,进而生成基于动态网页信息数据流的多文档文摘.针对不同阈值的多文档文摘比

较,了解时间信息在动态的多文档文摘中的重要性.实验证明在TDT的话题检测技术中,可通过调整 值的

α

方法来平衡TDT的输出结果,进而生成质量更好的动态多文档文摘.

关键词:话题检测;时间信息;动态阈值;多文档文摘

中图分类号:TP391 文献标志码:A 文章编号:0367-6234(2010)11-1767-04

Researchondynamicmultidocumentsummarizationbytopicdetection

andtrackingtechnology

1,2 1 1 1

LIUMeiling ,ZHAOTiejun,ZHENGDequan,YUYang

(1.SchoolofComputerScienceandTechnology,HarbinInstituteofTechnology,Harbin150001,China,mlliu@mtlab.hit.edu.cn;

2.CollegeofInformationandComputerEngineering,NortheastForestryUniversity,Harbin150040,China)

Abstract:Inthispapertimecharacteristicsofdynamicmultidocumentssummarizationhasbeenanalyzedby

theclusteringideaintopicdetectiontechnology.Fromthechangeoftimeinformationthresholdvalue,differ

entmultidocumentclusteringandmultidocumentssummarizationforthedynamicWebinformationdata

streamcanbegenerated.Bycomparedwithdifferentthresholdvalues,theimportanceoftimeinformationina

dynamicmultidocumentsummarizationisunderstanded.Experimentalresultmeansthatyoucancounterpoise

theoutputofTDTbyadjusting valueandgeneratebetterqualitydynamicmultidocumentsummarization.

α

Keywords:topicdetection;temporalproperties;dynamicthreshold;multidocumentsummariz

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值