贝叶斯定理 php,Spark mllib 贝叶斯分类

本文介绍了如何利用贝叶斯定理计算在已知P(A|B)的情况下P(B|A)的概率,通过一个使用Spark MLlib的Naive Bayes模型实例,展示了如何在实际问题中运用这一理论。重点讲解了条件概率的概念及其在数据挖掘中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

贝叶斯定理

已知某条件概率,如何得到两个事件交换后的概率,也就是在已知P(A|B)的情况下如何求得P(B|A)。这里先解释什么是条件概率:

表示事件B已经发生的前提下,事件A发生的概率,叫做事件B发生下事件A的条件概率。其基本求解公式为:

e15645fc1e1894b703dbe9a83e64bfe3.gif

贝叶斯定理之所以有用,是因为我们在生活中经常遇到这种情况:我们可以很容易直接得出P(A|B),P(B|A)则很难直接得出,但我们更关心P(B|A),贝叶斯定理就为我们打通从P(A|B)获得P(B|A)的道路。

下面直接给出贝叶斯定理:

4efdd6491f2b7bf3de6234a6e8250070.gifpackage com.immooc.spark

import org.apache.log4j.{Level, Logger}

import org.apache.spark.mllib.classification.NaiveBayes

import org.apache.spark.mllib.linalg.Vectors

import org.apache.spark.mllib.regression.LabeledPoint

import org.apache.spark.{SparkConf, SparkContext}

object NaiveBayesTest {

def main(args:Array[String]): Unit = {

val conf = new SparkConf().setAppName("NaiveBayes").setMaster("local[2]")

val sc = new SparkContext(conf)

Logger.getRootLogger.setLevel(Level.WARN)

val data = sc.textFile("file:///Users/walle/Documents/D3/sparkmlib/football.txt")

val parsedData = data.map{ line =>

val parts = line.split(',')

LabeledPoint(parts(0).toDouble, Vectors.dense(parts(1).split(' ').map(_.toDouble)))

}

val splits = parsedData.randomSplit(Array(0.6, 0.4), seed = 11L)

val training = splits(0)

val test = splits(1)

val model = NaiveBayes.train(training, lambda = 1.0, modelType = "multinomial")

val predictionAndLabel = test.map(p => (model.predict(p.features), p.label))

val print_predict = predictionAndLabel.take(20)

for (i

println(print_predict(i)._1 + "\t" + print_predict(i)._2)

}

println("Predictionof (0.0, 2.0, 0.0, 1.0):"+model.predict(Vectors.dense(0.0,2.0,0.0,1.0)))

}

}

1. 数据0,0 0 0 0

0,0 0 0 1

1,1 0 0 0

1,2 1 0 0

1,2 2 1 0

0,2 2 1 1

1,1 2 1 1

0,0 1 0 0

1,0 2 1 0

1,2 1 1 0

1,0 1 1 1

1,1 1 0 1

1,1 0 1 0

0,2 1 0 1

2. 输出1.01.0

1.01.0

0.01.0

1.01.0

0.00.0

Predictionof (0.0, 2.0, 0.0, 1.0):0.0

Post Views: 3

Related Posts 4671

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值