油管最火十分钟机器学习数学课-降维

本文探讨了降维技术在数据分析中的应用,重点介绍了主成分分析(PCA)的方法。PCA通过将数据转换到低维子空间,实现数据可视化并揭示隐藏关系。文章详细解释了PCA的步骤,包括数据标准化、特征分解等。

降维就是 发现数据中非线性与非局部的关系,而这些关系在原始的特征空间中是不明显的。如果我们能够减少某些数据的维度,我们就可以将其可视化,因为在二维和三维中的投影可以绘制出来。在一个具有多维度的数据集上训练一个数据模型,通常很多复杂,而且容易发生过拟合。并非所有的特征都和我们要解决的问题是相关的。如果我们能够减少维度就可以减少噪音也就是数据中无关紧要的部分。

降维分为两个部分即特征选择和特征抽取。

特征选择是指找到与问题相关的特征,选择依据可以基于我们个人的直觉或者我们可以训练一个模型让它找到最佳特征(深度学习)。特征抽取是指把数据从高纬度空间转到低纬度空间之后找到新的特征。降维的一种方法是主成分分析(PCA),PCA将原有的变量转换成一组新的变量,而新的变量是原变量的线性组合,这些新的变量被称作主成分。PCA是一次正交线性变换,将原有的数据转到新的坐标系,这样投影之后,第一个主成分的方差最大,第二个成分方差第二,以此类推。方差是用来衡量数据是如何分布的。一个篮球队球员身高方差是很小的,但加入一组小学生身高数据后,整个数据集的方差便会很大。

PCA第一步是将数据标准化,PCA是一个最大化方差的过程,它将原有的数据投射到某一个方向以最大化方差。我们画出一个小的数据集不同主成分之间的方差,好像只需要一个成分就可以解释数据集中所有的方差。但是如果先对数据进行标准化,可以看出其他成分也会对总的方差有一定贡献。

                              

标准化是指数据用同一个单位来衡量,比如用克表示重量这意味着数据的方差为1,平均值为零。方差可以说明一组测量值与平均值有多分散,一旦我们数据标准化,我们将进行特征分解。在线性代数中,特征向量是在线性变化下方向不会改变的向量。

总的来说,主成分分析将数据集转化到一个低维子空间,所以能够进行可视化,从而我们可以找到其中隐含关系。主成分就是结合特征值的特征向量,它们描述了在初始特征空间的数据中最大方差的方位,方差衡量了数据到底有多分散。

 

**项目名称:** 基于Vue.js与Spring Cloud架构的博客系统设计与开发——微服务分布式应用实践 **项目概述:** 本项目为计算机科学与技术专业本科毕业设计成果,旨在设计并实现一个采用前后端分离架构的现代化博客平台。系统前端基于Vue.js框架构建,提供响应式用户界面;后端采用Spring Cloud微服务架构,通过服务拆分、注册发现、配置中心及网关路由等技术,构建高可用、易扩展的分布式应用体系。项目重点探讨微服务模式下的系统设计、服务治理、数据一致性及部署运等关键问题,体现了分布式系统在Web应用中的实践价值。 **技术架构:** 1. **前端技术栈:** Vue.js 2.x、Vue Router、Vuex、Element UI、Axios 2. **后端技术栈:** Spring Boot 2.x、Spring Cloud (Eureka/Nacos、Feign/OpenFeign、Ribbon、Hystrix、Zuul/Gateway、Config) 3. **数据存储:** MySQL 8.0(主数据存储)、Redis(缓存与会话管理) 4. **服务通信:** RESTful API、消息队列(可选RabbitMQ/Kafka) 5. **部署与运:** Docker容器化、Jenkins持续集成、Nginx负载均衡 **核心功能模块:** - 用户管理:注册登录、权限控制、个人中心 - 文章管理:富文本编辑、分类标签、发布审核、评论互动 - 内容展示:首页推荐、分类检索、全文搜索、热门排行 - 系统管理:后台仪表盘、用户与内容监控、日志审计 - 微服务治理:服务健康检测、动态配置更新、熔断级策略 **设计特点:** 1. **架构解耦:** 前后端完全分离,通过API网关统一接入,支持独立开发与部署。 2. **服务拆分:** 按业务域划分为用户服务、文章服务、评论服务、文件服务等独立微服务。 3. **高可用设计:** 采用服务注册发现机制,配合负载均衡与熔断器,提升系统容错能力。 4. **可扩展性:** 模块化设计支持横向扩展,配置中心实现运行时动态调整。 **项目成果:** 完成了一个具备完整博客功能、具备微服务典型特征的分布式系统原型,通过容器化部署验证了多服务协同运行的可行性,为云原生应用开发提供了实践参考。 资源来源于网络分享,仅用于学习交流使用,请勿用于商业,如有侵权请联系我删除!
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值