spark中的表格操作

先在MySQL创建表格(随便创建一个)

pyspark中的文件创建和改动

(1)连接MySQL

>>>prop = {'user':'root','password':'123456','driver':'com.mysql.cj.jdbc.Driver'}
>>> url = 'jdbc:mysql://localhost:3306/people'

(2)csv文件读取数据创建df

(3)csv写入数据(先备份)

>>>df.write.jdbc(properties=prop,url=url,table='people_info',mode='append')
>>>df = spark.read.csv('file:///home/spark/mydata/people_info.csv',schema='id long,gender string,height int')


(4)json文件的创建

>>> spark.read.json('file:///home/spark/mydata/people_info.json').show()
>>>spark.read.load('file:///usr/local/spark/examples//src/main/resources/users.parquet').show()

数据查询

(1)筛选

>>> df.where('age>=10 and score>80').show()
>>> df.where((df.age>10) & (df.score>80)).show()

(2)排序

>>> df.sort(df.age).show()
>>> df.sort(df.age.desc()).show()
>>> df.sort(df.age,df.score,ascending=[1,0]).show()
>>> df.sort(df.age,df.score.desc()).show()
>>> df.sort(df.age.desc(),df.score.asc()).show()

(3)查询

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值