Event Hub: https://docs.microsoft.com/en-us/azure/event-hubs/event-hubs-what-is-event-hubs
Event Hub和Databricks集成:https://docs.azuredatabricks.net/spark/latest/structured-streaming/streaming-event-hubs.html
看文档总是比较生涩,这里我们通过模拟一个简单的spark streaming job来说明databricks上怎么用eventhub作为数据源来运行spark streaming job。首先我们需要在azure上建一个event hub,获取到它的connection string。有了这个string,我们就可以模拟往这个event上发数据流信息。下面就是一个简单的例子。
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using Microsoft.ServiceBus;
using Microsoft.ServiceBus.Messaging;
using System.Threading;
namespace ConsoleApplication1
{
class SendMessageToEventHubs
{
private readonly stri

本文通过创建一个简单的Spark Streaming作业,演示在Azure Databricks中如何使用Event Hub作为数据源。首先在Azure上设置Event Hub并获取连接字符串,然后模拟向Event Hub发送数据流。一旦数据流入Event Hub,使用Scala代码从Event Hub读取数据并作为Spark Streaming任务的输入,成功执行后,Databricks的日志将显示已从Event Hub提取到数据。
最低0.47元/天 解锁文章
389

被折叠的 条评论
为什么被折叠?



