Atitit 文档全文索引的索引种类 用于文本数据挖掘 搜索 数据分析 目录 1.1. Txt摘要索引。。 1 1.2. File placeholder 索引 1 1.3. Lucence索引 1

本文介绍了用于文本数据挖掘、搜索和数据分析的文档全文索引种类,包括Txt摘要索引、File placeholder索引、Lucence索引,还提及与源文件位置关联的方法、索引文件的互相转换以及索引的增量更新方式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Atitit 文档全文索引的索引种类 用于文本数据挖掘 搜索 数据分析

 

目录

1.1. Txt摘要索引。。 1

1.2. File placeholder 索引 1

1.3. Lucence索引 1

2. 与源文件位置关联 1

3. 索引文件的互相转换 2

4. 索引的增量更新 2

 

 

    1. Txt摘要索引。。

搜索方法,使用notepad++ 遍历搜索

 

    1. File placeholder 索引

索引方法,使用everthing文件搜索工具搜索

 

 

    1. Lucence索引

搜索方法,使用api或nuke工具搜索

NLP(自然语言处理)

 

  1. 与源文件位置关联

直接在索引文件里面写入法。。这个比较好。

索引文件命名上目录结构与元文件相同。。

 

 

  1. 索引文件的互相转换

Txt摘要索引 转换 placeholder·索引,转换lucence索引

 

  1. 索引的增量更新

要有个index log 记录更新情况表  按照年月日,,或者主题来更新比较好。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值