Druid 从本地文件加载数据
假设你已经按上一篇文章《Apache Druid入门系列(二): 安装配置》下载并安装了druid,并使用micro-quickstart 启动了druid单机配置,并让它在你的虚拟机上运行。您还不没有加载任何数据(如果已加载测试数据,先停止druid服务,后删除var目录即可)
本教程以druid官方自带的示例文件为例,教你发何从文件中批量摄取数据,数据位于:/usr/druid/apache-druid-0.16.0-incubating/quickstart/tutorial/wikiticker-2015-09-12-sample .json.gz中,在接下来的数据加载教程中,其中包含2015年9月12日发生的Wikipedia页面编辑事件。
1、打开http://192.168.1.164:8888,点击"Start a new spec",建一个新的数据摄入规范
2、选择"Local disk" 并单击"Connect data"
- firehoses type 选择:“local”, 摄入的文件必须放在本地服务器上
- firehose.baseDir输入:"/usr/druid/apache-druid-0.16.0-incubating/quickstart/tutorial/"
- firehose.filter 输入:“wikiticker-2015-09-12-sampled.json.gz”
单击[Preview]并确保您所看到的数据是正确的
3、单击“Next: Parse data”进入下一步解析数据
Parser