从领域分析中提取维基百科文章可信度
1. 背景与问题提出
在网络信息的海洋中,如何评估信息的可信度是一个关键问题。以维基百科为例,它具有更新速度快的特点,热门和常编辑的文章每天平均有 50 次修改,与近期新闻相关的文章修改次数可达数百次。这一特性使得一些传统的信任评估技术在维基百科上难以有效应用。
- 人类反馈和推荐系统 :这类系统需要时间来积累数据才能正常工作,存在“启动问题”。而维基百科页面变化迅速,推荐信息可能很快失去意义。并且,随着文章数量的增加和内容的碎片化,需要更多的评级才能使推荐有意义。
- 基于过往证据的信任范式 :该范式假设信任方与被信任方有足够的过往交互来收集重要证据。但在维基百科中,页面的过往版本对评估当前可信度的参考价值不大,文章内容不断变化,难以基于过往证据计算信任值。
综合来看,用户过往与网站的交互经验在评估网站质量的标准中仅占第 14 位,占比 4.6%。因此,需要一种仅依赖文章当前状态来评估其可信度的机制。
2. 维基百科的领域分析
维基百科涉及两个重要领域:内容质量领域和协作编辑领域。
2.1 内容质量领域
在线内容质量是许多机构面临的关键问题。不同研究提出了评估内容质量的标准:
- Alexander 的观点 :信息质量的三个基本要求是客观性、完整性和多元性。客观性确保信息无偏见,完整性要求信息不缺失,多元性强调避免信息局限于单一观点。
- 伯克利大学的评估方法 <
超级会员免费看
订阅专栏 解锁全文
599

被折叠的 条评论
为什么被折叠?



