语料库
加载一个包含文本文档的语料库(可选择性标注类别),或更改输入信号以导入语料数据。
输入
- 数据:输入数据(可选)
输出
- 语料库:一组文档的集合。
语料库组件 有两种工作模式:
-
无输入数据时:
从文件中读取文本语料库,并通过输出通道发送语料库实例。组件会维护最近打开文件的历史记录,并附带预装的示例语料库目录。支持的文件格式包括:- Excel (.xlsx)
- 逗号分隔文件 (.csv)
- 原生制表符分隔文件 (.tab)
-
有输入数据时:
将输入数据转换为语料库。用户可指定哪些特征作为文本特征使用。
界面功能说明:
- 浏览之前打开的数据文件,或加载示例文件。
- 浏览本地数据文件。
- 重新加载当前选中的文件。