【蓝皮书系列】感知机

本文详细介绍感知机对偶形式的原理及其实现过程,并通过Python代码实现了算法流程。此外,还展示了如何通过绘制决策边界来直观理解感知机的学习效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本篇博客搬运自个人简书链接戳我,欢迎大家关注。
感知机作为最经典的学习算法,其基本原理就不再冗述。本片文章对蓝皮书P33~34页的对偶算法进行了实现。

Part i 算法详解

=================感知机对偶形式伪代码=====================
输入:线性可分数据集X,标签y,学习率η
输出:输出α,b;以及决策界面:
图片来源于《统计学习方法》

=======================================================
Step.1 α ← 0,b←0
Step.2 选取某个样本图片来源于《统计学习方法》
Step.3 判断该样本是否为误分样本, 判断条件如下:
图片来源于《统计学习方法》
如果是,则对α,b按照以下规则更新:
图片来源于《统计学习方法》

Step.4 重复步骤2、3,直至没有误分类的样本

Part ii Python实现

  • 定义一个perception()类,输入参数X,y和η
    并初始化内积矩阵Gram,拉格朗日系数 α以及偏置b
def __init__(self,x,y,yta=1.0):
        self.__x = x
        self.__y = y
        # 初始化gamm矩阵
        Gram = np.zeros([x.shape[0],x.shape[0]])
        for i in range(x.shape[0]):
            for j in range(x.shape[0]):
                Gram[i,j] = np.dot(x[i,:],x[j,:].T )
        self.__Gram = Gram
        # 初始化训练处置
        self.a = np.zeros([x.shape[0]])
        self.b = 0
        self.__yta = yta
        self.w = np.zeros([x.shape[1]])
  • 在类中定义一个判断函数Condition(self,t),用于判断某个样本是否为误分类样本。
def Condition(self,t):
        result = 0
        yi = self.__y[t]
        coni = np.sum( self.a * self.__y * self.__Gram[:,t]) + self.b
        if yi * coni <= 0:
            result = 1
        return result
  • 接着就可以开始训练感知机了,定义训练函数def fit(self)
def fit(self):
        Num = self.__x.shape[0]
        Out = False
        # 训练
        while True:        
            for i in range(Num):
                if self.Condition(i):
                    self.a[i] += self.__yta
                    self.b += self.__yta * self.__y[i]
                    break
            else:
                Out = True

            if Out:
                break

        # 计算权重w
        for i in range(Num):
            self.w += self.a[i] * self.__x[i,:] * self.__y[i]
  • 到此为止,一个感知器的训练程序基本上已经完成了,但是为了能够让感知机对新的数据进行测试,还得加入一个预测函数predict(self,x)
def predict(self,x):
        return np.sign( np.dot(x,self.w )+self.b )
  • 当然了,为了能够清楚的观察到决策界面,所以又增加了一个可视化决策界面的函数。但是对于人类这种三维生物,只有低于三维的世界才有着绝对的上帝视角,所以咱的可视化函数也只对三维以下的数据集有效
def plot_decision_surface(self,x = None):
        if self.__x.shape[1] >2:
            return None
        else:
            import matplotlib.pyplot as plt 
            plt.figure()
            plt.scatter(self.__x[:,0],self.__x[:,1],c=self.__y,marker='p',s=200)
            # 计算超平面
            mgx = np.arange(-5,5,0.01)
            mgy = -self.b-self.w[0]*mgx
            mgy /= self.w[1]
            # 画出超平面
            plt.plot(mgx,mgy)      
            try:
                plt.scatter(x[:,0],x[:,1],c='r',marker='s',s = 50)
            except:
                x = None

Part iii 感知机实验运行结果
- 随机设置了一些坐标点和标签,正反例反别用 紫色黄色区分

x = np.array([[-3,3],[4,3],[1,1],[2,5],[3,5],[1,2],[2,3]])
y = np.array([-1,1,-1,-1,1,-1,-1])
  • 并且设置了两个预测样本,用红色表示
x_test = np.array([[0,0],[5,5]])

调用part ii 中的编写的感知机函数,进行预测

from Perception import perception
per = perception(x,y)
per.fit()
y_pred = per.predict( x_test )
per.plot_decision_surface(x_test)

最终实验结果:
感知机运行结果

资源下载链接为: https://pan.quark.cn/s/22ca96b7bd39 在 IT 领域,文档格式转换是常见需求,尤其在处理多种文件类型时。本文将聚焦于利用 Java 技术栈,尤其是 Apache POI 和 iTextPDF 库,实现 doc、xls(涵盖 Excel 2003 及 Excel 2007+)以及 txt、图片等格式文件向 PDF 的转换,并实现在线浏览功能。 先从 Apache POI 说起,它是一个强大的 Java 库,专注于处理 Microsoft Office 格式文件,比如 doc 和 xls。Apache POI 提供了 HSSF 和 XSSF 两个 API,其中 HSSF 用于读写老版本的 BIFF8 格式(Excel 97-2003),XSSF 则针对新的 XML 格式(Excel 2007+)。这两个 API 均具备读取和写入工作表、单元格、公式、样式等功能。读取 Excel 文件时,可通过创建 HSSFWorkbook 或 XSSFWorkbook 对象来打开相应格式的文件,进而遍历工作簿中的每个 Sheet,获取行和列数据。写入 Excel 文件时,创建新的 Workbook 对象,添加 Sheet、Row 和 Cell,即可构建新 Excel 文件。 再看 iTextPDF,它是一个用于生成和修改 PDF 文档的 Java 库,拥有丰富的 API。创建 PDF 文档时,借助 Document 对象,可定义页面尺寸、边距等属性来定制 PDF 外观。添加内容方面,可使用 Paragraph、List、Table 等元素将文本、列表和表格加入 PDF,图片可通过 Image 类加载插入。iTextPDF 支持多种字体和样式,可设置文本颜色、大小、样式等。此外,iTextPDF 的 TextRenderer 类能将 HTML、
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值