使用NewsML组织企业新闻资源

NewsML是一种描述多媒体新闻内容的XML文法,为新闻行业提供统一的数据格式。本文介绍NewsML的基本概念、结构及其应用方式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

<script type="text/javascript" src="http://pagead2.googlesyndication.com/pagead/show_ads.js"> </script> 在互联网上最受欢迎的信息之一就是新闻。从CNN到Slashdot,许多人将互联网作为他们主要的新闻来源。许多现有的新闻站点使用一个称为Rich Site Summary(RSS)的协议来联合他们的新闻头条和文章。现在有一个新的叫做NewsML的XML协议来完成这项工作。 开发人员将会因为以下的几个原因对NewsML感兴趣。首先,对于入口开发人员来说,他们可以使用NewsML来管理他们企业联合的新闻资源。同样,对于内容开发人员来说,他们可以使用NewsML来描述他们的面向新闻的多媒体格式的内容。在上面两种情况下,NewsML提供了一种丰富的XML解决方案来描述企业联合的多媒体数据。 什么是NewsML NewsML实际上是一种描述多媒体新闻内容的XML文法。这里的多媒体指的是美联社或者路透社那种典型的在线新闻,私人拥有的新闻视频以及其他的一些多媒体数据。使用NewsML,内容辛迪加可以基于他们的新闻资源提供一种统一的格式。 NewsML由IPTC(the International Press and Telecommunication)维护,NewsML的最初想法来源于路透社,是他们将这个想法提交给了IPTC。 下面的Listing 1展示了一个来自IPTC的有效载荷NewsML样例: Listing 1: SportResult.xml <?xml version = "1.0" encoding = "UTF-8"?> <!DOCTYPE NewsML PUBLIC "urn:newsml:iptc.org:20001006:NewsMLv1.0:1" "./DTD/NewsMLv1.0.dtd"> <?xml-stylesheet type="text/xsl"href="./stylesheets/IPTCNewsML.xsl"?> <NewsML> <Catalog Href = "./catalog/mycatalog.xml"/> <NewsEnvelope> <DateAndTime>20001006</DateAndTime> </NewsEnvelope> <NewsItem> <Identification> <NewsIdentifier> <ProviderId>iptc.org</ProviderId> <DateId>20001006</DateId> <NewsItemId>SportsResultSample</NewsItemId> <RevisionId PreviousRevision = "0" Update ="N">1</RevisionId> <PublicIdentifier>urn:newsml:iptc.org:20001006:SportsResultSample:1 </PublicIdentifier> </NewsIdentifier> </Identification> <NewsManagement> <NewsItemType FormalName = "News" Scheme ="IptcNewsItemType"/> <FirstCreated>20001006</FirstCreated> <ThisRevisionCreated>20001006</ThisRevisionCreated> <Status FormalName = "Usable" Scheme ="IptcStatus"/> </NewsManagement> <NewsComponent> <ContentItem> <DataContent><![CDATA[<FootballResult><Hteam>Arsenal</Hteam><Hscore>1 </Hscore><Ateam>Chelsea</Ateam><Ascore>2</Ascore></FootballResult>]]> </DataContent> </ContentItem> </NewsComponent> </NewsItem> </NewsML> 资源和格式 NewsML为打包来自不同来源的企业组合的多媒体新闻数据提供了包装机制。在NewsML内部,也许会有多种指定的新闻内容格式。一种格式称为News Industry Text Format,它被用来描述基于文本的新闻文章。另一个正在处于上升势头的格式是Sports Markup Language,或者称为SportsML,它是一种描述体育成绩和统计数据的协议。 实际上有很多种方法来接受新闻资源。一种简单的模式是使用SMTP,这种技术将NewsML数据报发送到电子邮箱之中;另一种模式是用FTP,这种技术将NewsML数据报发送到一个FTP站点。一个更实时地方法是使用一个代理直接接受NewsML地有效载荷。这个代理可以是一个简单的通过TCP socket接受数据的服务器,也可以内嵌在Web service这种。 工具 只有少数工具可以和NewsML资源和文档协同工作。用户可以从不同的来源获得样例文档和资源,这些来源可以是路透社或者道琼斯。SourceForge.net主导了NewsML的工具包,这是一个基于Java的工具集。 很多网站都有NewsML的其他信息,包括规范、DTD和其他的文档。IPTC网站是个查找相关网站的不错地方。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值