CH2_感知机算法原理及其spark 实现

本文深入探讨感知机算法的基本原理,这是一种用于解决二分类线性分类问题的经典模型。感知机由Rosenblatt在1957年提出,尽管历史悠久,但其简单性和实用性使其成为深度学习和神经网络领域的基石。文章详细介绍了感知机模型的输入输出空间,以及如何通过符号函数进行分类。此外,还提供了感知机算法的实现步骤,包括初始化参数、样本选择、错误检测和权重更新过程。最后,通过Spark框架实现了感知机算法,展示了从数据读取、预处理到模型训练的全过程。

CH2_感知机算法原理及其spark 实现

一.感知机

感知机是二分类的线性分类问题,由Rosenblatt在1957年提出,虽然年代久远,但是感知机简单实用易实现,并且是深度学习神经网络的基础。感知机模型的输入是样本的特征向量,输出是样本的类别,分别为“+1”,“-1”,如果训练样本是线性可分的数据集,则感知机学习将会得到一个将训练数据集的两类样本点完全正确分开的超平面。非线性可分数据集则不能训练得到这个超平面,对于非线性可分的数据集做训练只能通过其他优化方法得出一个较好的模型。
线性可分数据集
非线性可分数据集

二.感知机模型

输 入 空 间 ( 特 征 空 间 ) : X ⊑ R n 输入空间(特征空间):X\sqsubseteq R^n ():XRn
输 出 空 间 : y = { − 1 , + 1 } 输出空间: y=\{-1,+1\} :y={1,+1}
由输入空间到输出空间的函数:f(x) = sing(w·x+b),其中w称为权值向量,b称为偏置,sign是符号函数:
s i g n ( x ) = { + 1 x ≥ 0 − 1 x < 0 sign(x)= \left\{ \begin{aligned} +1 & & x\ge 0 \\ -1& & x<0 \end{aligned} \right. sign(x)={+11x0x<0
感知机模型的几何解释:线性方程 w·x+b = 0 对应于特征空间R的一个超平面S,其中
w是超平面的法向量,b是超平面的截距。这个超平面正好将样本空间划分成两部分,将正负两类数据完全分开。
超平面

三.感知机算法实现步骤

感知机算法原始形式的实现步骤:
输入:训练数据集T=(x1,y1),(x2,y2),…,(xN,yN),yi∈{−1,+1},学习率η(0<η<1)
输出:w,b;感知机模型f(x)=sign(w⋅x+b)
(1)赋初值 w0,b0
(2)选取数据点(xi,yi)
(3)根据判定函数判断样本点是否误判:即yi(w·xi+b)<=0,如果误判则更新w和b:
w = w + η y i x i w=w+ηy_ix_i w=w+ηyixi
b = b + η y i b = b+ηy_i b=b+ηyi
(4)转到第二步,知道训练集中没有误判点。

感知机算法有两种形式 1. 原始形式算法,2.对偶形式,两种形式的实现步骤基本一样,只是对于权值向量(w)和偏置(b)的计算不同。本文只实现了算法的原始形式。更多信息请读者自行参考相关资料。

关于感知机算法的损失函数计算,对偶形式、以及相关证明等其他信息,读者可以参考李航老师的《统计学习方法》一书。

四.代码实现

package ML2_3.classification.pla


import breeze.linalg.{DenseVector => densevector}
import org.apache.spark.ml.feature.VectorAssembler
import org.apache.spark.ml.linalg.DenseVector
import org.apache.spark.sql.expressions.Window
import org.apache.spark.sql.{Row, SparkSession}
import org.apache.spark.sql.functions._
import org.apache.spark.sql.types.IntegerType
import scala.util.Random

/**
  * Created by WZZC on 2019/3/4
  * 针对线性可分的数据集构建感知机模型
  **/
object pla {
  def main(args: Array[String]): Unit = {


    val spark = SparkSession.builder()
      .appName(s"${this.getClass.getSimpleName}")
      .master("local[*]")
      .getOrCreate()

    import spark.implicits._

    val sc = spark.sparkContext
    val data = spark.read.option("inferSchema", true)
      .option("header", true)
      .csv("F:\\DataSource\\pla.csv")

    data .show()
    
    val schema = data.schema

    val fts = schema.filterNot(_.name == "lable").map(_.name).toArray

    val amountVectorAssembler: VectorAssembler = new VectorAssembler()
      .setInputCols(fts)
      .setOutputCol("features")

    val vec2Array = udf((vec: DenseVector) => vec.toArray)

    val dataFeatrus = amountVectorAssembler
      .transform(data)
      .select($"lable", vec2Array($"features") as "features")

    var initW = densevector.rand[Double](fts.length) //创建一个初始化的随机向量作为初始权值向量
    var initb = Random.nextDouble()  // 初始偏置
    var flag = true
    val lrate = 0.2  //学习率

    // 定义判定函数
    val signudf = udf((t: Seq[Double], y: Double) => {
      val wx = initW.dot(  densevector(t.toArray)  )
      val d = wx + initb
      val ny = if (d >= 0) 1 else -1
      ny
    })

    var resDf = spark.createDataFrame(sc.emptyRDD[Row], dataFeatrus.schema.add("nG", IntegerType))

    while (flag) {
      val df = dataFeatrus.withColumn("sign", signudf($"features", $"lable"))
      val loss = df.where($"sign" =!= $"lable")
      val count = loss.count()
      println("error:" + count)
      if (count == 0) {
        resDf = df
        flag = false
      }
      else {
        // w1 = w0 + ny1x1
        //随机选择一个误判样本
        val rand = Random.nextInt(loss.count().toInt) + 1
        println(rand)
        val randy = loss
          .withColumn("r", row_number().over(Window.partitionBy($"lable").orderBy($"lable")))
          .where($"r" === rand)
          .head()

        val y = randy.getAs[Int]("lable")
        
       //更新w和b
        initW = initW + densevector(randy.getAs[Seq[Double]]("features").toArray).map(_ * y * lrate)
        // b1 = b0 + y
        initb = initb + y * lrate
      }
    }

    println(initW, initb)

    spark.stop()
  }
}

数据原始格式与训练结果对比

// 数据源格式
+---+---+-----+
| x1| x2|lable|
+---+---+-----+
|5.1|3.0|    1|
|5.7|4.1|    1|
|5.1|1.4|   -1|
|4.9|1.4|   -1|
// 训练结果展示
+-----+----------+----+
|lable|  features|sign|
+-----+----------+----+
|    1|[5.1, 3.0]|   1|
|    1|[5.7, 4.1]|   1|
|   -1|[5.1, 1.4]|  -1|
|   -1|[4.9, 1.4]|  -1|

// 模型系数
(DenseVector(-1.107892749276022, 2.043043387141929),-0.3484139882261944)

在本案例中,只针对线性可分的数据集进行训练,对于非线性可分的处理在下次分享中再给读者们介绍。由于作者水平有限,在介绍及实现过程中难免有纰漏之处,感谢细心的朋友指正。

参考资料:

《统计学习方法》 --李航

<think>好的,用户想了解TIM5_CH2_Cap_Init函数的定义和作用,特别是在STM32定时器捕获初始化中的应用。首先,我需要回忆STM32的定时器输入捕获功能相关知识。输入捕获通常用于测量外部信号的频率、脉宽等,涉及定时器的配置,比如时基、捕获通道、中断等。 用户提供的引用[1]和[2]中有相关的代码示例,比如TIM5_Cap_Init和TIM2_Cap_Init。这些函数可能初始化定时器的ARR和PSC寄存器,设置捕获通道,配置中断等。但用户问的是TIM5_CH2_Cap_Init,这里的CH2可能指的是通道2,所以需要针对通道2进行配置。 接下来,我需要分析函数可能的定义。函数名中的CH2表明是针对定时器5的通道2。初始化函数通常会设置定时器的预分频器(PSC)和自动重装载值(ARR),配置输入捕获模式,选择边沿触发(比如上升沿或下降沿),开启中断等。此外,可能还需要配置GPIO引脚为输入模式,并映射到对应的定时器通道。 关于作用,TIM5_CH2_Cap_Init的作用应该是初始化定时器5的通道2为输入捕获模式,使其能够测量输入信号的脉宽或频率。例如,用于测量PWM信号的高电平时间,通过捕获上升沿和下降沿的时间差来计算。 需要检查用户提供的代码是否有类似的结构。引用[2]中的TIM2_Cap_Init可能是一个类似的函数,用于初始化TIM2的输入捕获,可能涉及NVIC配置、GPIO设置、定时器参数配置等。因此,TIM5_CH2_Cap_Init可能遵循相同的模式,但针对TIM5的通道2。 需要注意的是,不同的定时器通道对应的GPIO引脚不同,需要查阅STM32F103的数据手册或引脚分配表,确定TIM5_CH2对应的具体引脚,例如PA0或别的引脚。此外,配置输入捕获时,需要设置捕获/比较模式寄存器(CCMR),使能捕获,配置极性等。 可能还需要开启定时器的中断,在捕获事件发生时触发中断,记录捕获值。例如,在引用[2]中,使用了TIM2CH1_CAPTURE_STA和TIM2CH1_CAPTURE_VAL变量来存储捕获状态和值,类似地,TIM5_CH2可能需要类似的全局变量来跟踪状态。 最后,用户可能需要具体的代码示例,但根据问题,他们可能更关注函数的定义和作用,而不是完整的实现。因此,在回答中需要明确说明函数的参数(如arr和psc),以及各个配置步骤的作用,比如设置时基、捕获通道、中断等,并解释其在输入捕获中的应用场景。</think>### TIM5_CH2_Cap_Init 函数的定义与作用 #### 1. **函数定义** `TIM5_CH2_Cap_Init` 是STM32定时器输入捕获功能的初始化函数,用于配置定时器5的通道2为输入捕获模式。以下是其典型定义(基于STM32标准库): ```c void TIM5_CH2_Cap_Init(u16 arr, u16 psc) { TIM_TimeBaseInitTypeDef TIM_TimeBaseStructure; TIM_ICInitTypeDef TIM_ICInitStructure; GPIO_InitTypeDef GPIO_InitStructure; // 1. 使能时钟 RCC_APB1PeriphClockCmd(RCC_APB1Periph_TIM5, ENABLE); RCC_APB2PeriphClockCmd(RCC_APB2Periph_GPIOA, ENABLE); // 2. 配置GPIO(假设TIM5_CH2对应PA1) GPIO_InitStructure.GPIO_Pin = GPIO_Pin_1; GPIO_InitStructure.GPIO_Mode = GPIO_Mode_IPD; // 输入下拉模式 GPIO_Init(GPIOA, &GPIO_InitStructure); // 3. 配置定时器时基 TIM_TimeBaseStructure.TIM_Period = arr; // 自动重装载值 TIM_TimeBaseStructure.TIM_Prescaler = psc; // 预分频系数 TIM_TimeBaseStructure.TIM_ClockDivision = TIM_CKD_DIV1; TIM_TimeBaseStructure.TIM_CounterMode = TIM_CounterMode_Up; TIM_TimeBaseInit(TIM5, &TIM_TimeBaseStructure); // 4. 配置输入捕获通道2 TIM_ICInitStructure.TIM_Channel = TIM_Channel_2; TIM_ICInitStructure.TIM_ICPolarity = TIM_ICPolarity_Rising; // 上升沿捕获 TIM_ICInitStructure.TIM_ICSelection = TIM_ICSelection_DirectTI; // 直接输入 TIM_ICInitStructure.TIM_ICPrescaler = TIM_ICPSC_DIV1; // 不分频 TIM_ICInitStructure.TIM_ICFilter = 0x00; // 不滤波 TIM_ICInit(TIM5, &TIM_ICInitStructure); // 5. 使能捕获中断 TIM_ITConfig(TIM5, TIM_IT_CC2, ENABLE); // 使能通道2捕获中断 // 6. 启动定时器 TIM_Cmd(TIM5, ENABLE); } ``` #### 2. **函数作用** `TIM5_CH2_Cap_Init` 的作用是初始化定时器5的通道2为输入捕获模式,具体功能包括: - **测量信号参数**:通过捕获外部信号边沿(如上升沿/下降沿),计算信号的频率、占空比或高电平持续时间[^1]。 - **硬件关联**:配置GPIO引脚(如PA1)为输入模式,并与定时器5的通道2绑定。 - **中断触发**:在信号边沿到来时触发中断,记录捕获值(`TIM5->CCR2`)用于后续计算。 #### 3. **关键参数说明** - **`arr`**:自动重装载值,决定定时器的计数周期,影响最大可测量的时间范围。 - **`psc`**:预分频系数,将定时器时钟分频以适配不同频率的信号测量需求。 例如,若系统时钟为72MHz,`psc=71`时,定时器实际频率为 $f = \frac{72\ \text{MHz}}{71+1} = 1\ \text{MHz}$,对应时间分辨率为 $1\ \mu\text{s}$[^2]。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值