pyspark读取es

最新推荐文章于 2023-06-12 21:04:20 发布

原创

最新推荐文章于 2023-06-12 21:04:20 发布 · 1.5k 阅读

0 ·

CC 4.0 BY-SA版权

本地运行把jar包放到spark目录下
在这里插入图片描述

方式一：sqlcontext

def readEs():
    conf = SparkConf().setAppName("es").setMaster("local[2]")
    sc = SparkContext(conf=conf)
    sqlContext = SQLContext(sc)
    df = sqlContext.read.format("org.elasticsearch.spark.sql") \
        .option("es.nodes.wan.only", "true") \
        .option("es.nodes","ip")\
        .option("es.port","port") \
        .option("es.net.http.auth.user", "user") \
        .option("es.net.http.auth.pass", "passwd") \
        .option("es.resource","metricbeat-6.8.10-2020.09.22/doc")\
        .load()
    df.registerTempTable("test")
    value = sqlContext.sql("select * from test")
    value.show()
    sc.stop(