spark编程07——关于数据清洗中的时间格式(二)

这篇博客主要讨论了在处理各种不规范的时间数据格式时,如何进行转换和标准化。内容包括将带有冒号、点或无符号的小时分钟格式统一为HH:MM的标准格式,并针对特定数值如8、6、21、22等进行前导零补充。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

那些年遇到的杂七杂八时间数据:

数据问题
数据类型处理后格式
HH: MM(:后面有空格)HH:MM
HH.MMHH:MM
HHMMHH:MM
HH:MMHH:MM
808:00
606:00
2121:00
2222:00

def replaceTime3(time:String):String={
      var ansTime = time
      if(time.contains(":"))
      {
        val time1=new SimpleDateFormat("HH:mm")
        val time2=new SimpleDateFormat("HH:mm")
        val t: Date =time1.parse(time)
        ansTime=time2.format(t)
      }
      else if(time.contains("."))
      {
        val time1=new SimpleDateFormat("HH.mm")
        val time2=new SimpleDateFormat("HH:mm")
        val t: Date =time1.parse(time)
        ansTime=time2.format(t)
      }
      else if(!time.contains(":")&&(!time.equals("8"))&&(!time.equals("21"))&&(!time.equals("6"))&&(!time.equals("22")))
      {
        val time1=new SimpleDateFormat("HHmm")
        val time2=new SimpleDateFormat("HH:mm")
        val t: Date =time1.parse(time)
        ansTime=time2.format(t)
      }
      if(time.equals("8"))
        ansTime="08:00"
      if(time.equals("6"))
        ansTime="06:00"
      if(time.equals("21"))
        ansTime="21:00"
      if(time.equals("22"))
        ansTime="22:00"
      ansTime
    }

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值