信息处理与资源发现技术探索
在当今信息爆炸的时代,如何高效地传播、组织和处理信息成为了亟待解决的问题。本文将介绍几种在信息处理和资源发现领域的重要技术和系统,包括SVM与字符串匹配方法的性能比较、概念空间交换协议以及跨媒体索引系统。
SVM与字符串匹配方法性能对比
在文本分类等任务中,SVM(支持向量机)和字符串匹配方法(SM)是常用的技术。通过宏观平均实验结果比较它们的性能,发现两者在使用原始词汇表时表现最佳。以下是具体的实验数据:
|方法|Rec|Prec|F1|
| ---- | ---- | ---- | ---- |
|SVM - original (complete)|0.76|0.81|0.78|
|SVM - descriptive| - | - | - |
|SVM - distinctive|0.72|0.79|0.75|
|SM - original (controlled)|0.55|0.68|0.61|
|SM - distinctive + controlled|0.99|0.19|0.32|
|SM - descriptive|0.92|0.29|0.43|
|SM - distinctive|0.99|0.19|0.32|
从表中可以看出,字符串匹配算法的性能由于精度的大幅下降而降低。几乎每个文档都被分配了所有六个类别,这使得召回率接近100%。可以通过引入截断值来提高低精度的问题。
概念空间交换协议(CSIP)
在教育数字图书馆的资源发现中,概念空间交换协议(CSIP)发挥着重要作用。它基于表示状态转移(REST)
超级会员免费看
订阅专栏 解锁全文
1319

被折叠的 条评论
为什么被折叠?



