实时仪表盘案例分析
1. 常见问题及解决方法
在运行相关应用时,可能会遇到一些问题,以下是常见问题及解决办法:
- 数据显示问题 :有时数据可能不会显示在图表中,因为它可能超出了 X 轴的时间范围。如果使用两台机器,需要检查两台机器的时间偏移。
- Kafka 版本问题 :在特定环境中安装的 Kafka 版本存在已知问题。如果停止并重新启动 Spark 和 Kafka,可能会看到 “Kafka scheduler has not been started” 消息。解决方法是再次停止并启动 Spark 和 Kafka,之后应用程序应该可以正常工作。若仍然存在问题,可以通过指定论坛报告问题。
2. 手动启动应用程序
2.1 获取存档文件
可以自己构建组件存档,也可以从指定的 GitHub 仓库下载。存档位置如下:
- http://mng.bz/8uuF
- http://mng.bz/QJvi
- http://mng.bz/Ak6K
- 包含源文件的项目位于仓库的 ch13 文件夹中。
2.2 创建 Kafka 主题
需要创建两个 Kafka 主题,一个用于日志事件,一个用于统计信息。示例中命名为 weblogs 和 stats,也可以使用不同的名称。在脚本中,使用的复制因子为 1,每个主题一个分区。若要使用不同的值,可使用以下命令(需先启动 ZooKeeper 和 Kafka):
$ kafka-
超级会员免费看
订阅专栏 解锁全文
1588

被折叠的 条评论
为什么被折叠?



