Linked Data看上去十分美好,但从我看来似乎有很多待解决的问题

本文探讨了LinkedData在数据提取、记录与表达方面的难题。针对已有网页数据的自动提取、多媒体数据的有效记录方式以及如何自动组织数据进行展示等问题进行了讨论。

Linked Data看上去十分美好,但从我看来似乎有很多待解决的问题:

  • 如何提取数据

    我们已经有了成千上万个包含数据的网页,让我们手工的把这些数据提取出来难度很大。怎么样通过计算来自动提取这些数据?

  • 如何记录数据

    我们有了数据,需要好的方法来记录。对于文字数据来说,类似XML的文件记录看上去是不错的方案。但如何记录图片中的数据和视频中的数据?是把他们用文字描述出来再记录,还是用另外的方式直接记录?

  • 如何表达数据

    原始数据有用,但我们不能只把干巴巴的数据扔给读者,而需要“漂亮的”网页来呈现这些数据。前人已经有关于结合XML和TeX的研究,我相信格式方面是没有问题的。但是否能通过计算来自动组织文章,则是一个大的难题。比如我们有了关于奥巴马的数据,如出生日期、教育背景、家庭背景之类的,如何能让机器用语言来组织这些数据,成为一篇奥巴马的建立。这一方面需要期待人工智能和语言研究的发展。什么时候我们能做到这一步,自动写作这个迷人的目标就算实现了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值