$terms = array();
$prefix = 'Z';
for ($termi = $doc->termlist_begin(); !$termi->equals($doc->termlist_end()); $termi->next()) {
$term = array(
'wdf' => $termi->get_wdf(),
'freq' => $termi->get_termfreq(),
'name' => $termi->get_term(),
);
if ($term['name'][0] === $prefix) {
$term['name'] = substr($term['name'],1,strlen($term['name'])-1);
$terms[] = $term;
}
}
php使用xapian扩展时获取某篇文档的分词及词频
文档术语列表处理
最新推荐文章于 2022-04-26 18:14:11 发布
本文介绍了一种从文档中提取特定前缀的术语及其出现频率的方法。通过遍历文档的术语列表,筛选出以指定前缀开始的术语,并去除前缀,保留其后的部分作为新的术语名称。

1369

被折叠的 条评论
为什么被折叠?



