分析日志的包
自己编译下:
sbt compile
sbt test
sbt package
ApacheLogParser.jar
对于访问日志简单分析grep等利器比较好,但是更复杂的查询就需要Spark了。
代码:
import com.alvinalexander.accesslogparser._
val p = new AccessLogParser
val log = sc.textFile("log.small")
//log.count
//分析Apache日志中404有多少个
def getStatusCode(line: Option[AccessLogRecord]) = {
line match {