Orange3实战教程:文本挖掘---词汇丰富度分析

词汇丰富度分析

对选定文档进行词汇丰富度分析。

输入

  • 语料库:文档集合。
  • 选定数据:从语料库中选定的实例。

输出

词汇丰富度功能会显示选定子集与整个语料库相比具有较低 p 值(更高显著性)的词汇列表。p 值越低,表明该词汇在选定子集中越显著(非随机出现)。FDR(错误发现率)与 p 值相关,用于预测结果集中的错误预测比例,即控制低 p 值列表中的假阳性。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

  1. 输入信息说明
    • 聚类词汇:语料库中的所有词元。
    • 选定词汇:选定子集中的所有词元。
    • 过滤后:报告子集中发现的丰富词汇。
  2. 过滤器选项
    评论
    添加红包

    请填写红包祝福语或标题

    红包个数最小为10个

    红包金额最低5元

    当前余额3.43前往充值 >
    需支付:10.00
    成就一亿技术人!
    领取后你会自动成为博主和红包主的粉丝 规则
    hope_wisdom
    发出的红包

    打赏作者

    err2008

    你的鼓励将是我创作的最大动力

    ¥1 ¥2 ¥4 ¥6 ¥10 ¥20
    扫码支付:¥1
    获取中
    扫码支付

    您的余额不足,请更换扫码支付或充值

    打赏作者

    实付
    使用余额支付
    点击重新获取
    扫码支付
    钱包余额 0

    抵扣说明:

    1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
    2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

    余额充值