一天一段scala代码(九)
为了更好的驾驭spark,最近在学习scala语言特性,主要看《快学scala》,顺便把一些自己认为有用的代码记下来。
package examples
import scala.io.Source
object Example9 extends App {
val source = Source.fromFile("/home/linger/data/hive_data","UTF-8")
val lines = source.getLines()
for(l<-lines)
{
println(l)
}
lines.toArray
source.mkString
source.close()
//可以调用Java一些io库来处理文件
//正则表达式
val wsnumws = """\s[0-9]+\s+""".r //原始字符串形式
val wsnumws2 = "\\s[0-9]+\\s+".r //等价于上面,但需要转移
//正则提取器
val numitem = "([0-9]+) ([a-z]+)".r
val numitem(num,item) = "99 bottle"
println(num,item)
}
本文作者:linger
本文介绍了使用Scala语言学习Spark框架的过程,并通过实例展示了如何运用正则表达式处理文件内容。文章包括从文件读取、遍历到数据转换的完整流程,同时提及了调用Java IO库进行文件操作及正则表达式的具体应用。
1285

被折叠的 条评论
为什么被折叠?



