主成分分析法(PCA)答疑

本文详细解释了数据标准化的目的和步骤。标准化通过减去均值和除以标准差,使得数据坐标移至原点,便于进一步的数据分析。矩阵中不同量纲的数据在标准化后能够公平比较,特别适用于协方差矩阵的计算。对于图像数据,由于所有值在同一量纲下,因此只需进行均值减去操作。

问:为什么要去均值?

1、我认为归一化的表述并不太准确,按统计的一般说法,叫标准化。数据的标准化过程是减去均值并除以标准差。而归一化仅包含除以标准差的意思或者类似做法。
2、做标准化的原因是:减去均值等同于坐标的移动,把原始数据点的重心移到和原点重合,这样利于很多表达,比如数据的协方差矩阵可以写成XX',若没有减去均值,则XX‘后面还要减去一些东西(还不明白可以参考多元统计分析的书)。除以标准差是为了统一并消除量纲。一个矩阵中有多个向量,有些可能表示了长度,有些表示了重量,除以标准差,才能让它们仅以“数”的概念一起比较运算。
3、标准化的做法。举例,若你的矩阵A是5行3列,第一列表示长度,第二列表示时间,第三列表示质量,那么矩阵A等同于对这个三个量进行了5次测量,所以5*3.这样3个分量有各自的均值和标准差,对这个矩阵中15个元素均做标准化只要减去长度、时间、质量各自的均值并除以标准差即可。

4、图像不需要除以标准差,因为他们都是像素值,同量纲同尺度。只减均值就行。

转载于:https://www.cnblogs.com/yyxayz/p/4150170.html

标题基于Python的自主学习系统后端设计与实现AI更换标题第1章引言介绍自主学习系统的研究背景、意义、现状以及本文的研究方法和创新点。1.1研究背景与意义阐述自主学习系统在教育技术领域的重要性和应用价值。1.2国内外研究现状分析国内外在自主学习系统后端技术方面的研究进展。1.3研究方法与创新点概述本文采用Python技术栈的设计方法和系统创新点。第2章相关理论与技术总结自主学习系统后端开发的相关理论和技术基础。2.1自主学习系统理论阐述自主学习系统的定义、特征和理论基础。2.2Python后端技术栈介绍DjangoFlask等Python后端框架及其适用场景。2.3数据库技术讨论关系型和非关系型数据库在系统中的应用方案。第3章系统设计与实现详细介绍自主学习系统后端的设计方案和实现过程。3.1系统架构设计提出基于微服务的系统架构设计方案。3.2核心模块设计详细说明用户管理、学习资源管理、进度跟踪等核心模块设计。3.3关键技术实现阐述个性化推荐算法、学习行为分析等关键技术的实现。第4章系统测试与评估对系统进行功能测试和性能评估。4.1测试环境与方法介绍测试环境配置和采用的测试方法。4.2功能测试结果展示各功能模块的测试结果和问题修复情况。4.3性能评估分析分析系统在高并发等场景下的性能表现。第5章结论与展望总结研究成果并提出未来改进方向。5.1研究结论概括系统设计的主要成果和技术创新。5.2未来展望指出系统局限性并提出后续优化方向。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值