Orange3实战教程:文本挖掘---语料库转网络

语料库转网络

根据给定的语料库创建网络。网络节点可以是文档或单词(n-grams)。

输入

  • 语料库:文档集合。

输出

  • 网络:从输入语料库生成的网络。
  • 节点数据:节点的附加数据。

语料库转网络 可以基于文档或单词(n-grams)操作。

  • 若节点为文档,则当两个文档共享的单词(n-grams)数量至少达到 阈值 时,它们之间会有一条边。
  • 若节点为单词(n-grams),则当两个单词在窗口(大小为 (2 \times \text{窗口大小} + 1))内共同出现的次数至少达到 阈值 时,它们之间会有一条边。只有频率高于 频率阈值 的单词才会被作为节点包含。这是一种 词共现网络

网络示意图

  1. 小部件参数
    • 节点类型:控制节点是文档还是单词(n-grams
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

err2008

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值