统计学习方法-方法概论(3)

本文主要探讨了监督学习中的三个核心问题:分类、标注及回归。详细解释了这些问题的基本概念、评价指标及常用方法。

分类问题

概述

分类是监督学习的一个核心问题 
在监督学习中,当输出变量Y取有限个离散值时,预测问题便成为分类问题
输入变量X可以是离散的,也可以是连续的 监督学习从数据中学习一个分类模型或分类决策函数 称为分类器
分类器对新的输入进行输出的预测 称为分类
可能的输出称为类

评价指标

对于二类分类问题常用的评价指标是精确率与召回率
分类器在测试数据集上的预测或正确或不正确 有四种情况发生
TP: 将正类预测为正类数
FN: 将正类预测为负类数
FP: 将负类预测为正类数
TN: 将负类预测为负类数

精确率为:P=TPTP+FPP=TPTP+FP 预测正类数/所有正类的预测数
召回率为:R=TPTP+FNR=TPTP+FN 预测正类数/正类数
F1:2F1=1p+1RF1值:2F1=1p+1R
即为:F1=2TP2TP+FP+FNF1=2TP2TP+FP+FN
许多统计学习方法可以用于分类: KNN, 感知机,不朴素贝叶斯法,决策树,决策列表,逻辑回归,支持向量机,提升方法,贝叶斯网络,神经网络,Winnow等

标注问题

概述

标注也是监督学习问题
标注问题的输入是观测序列,输出是一个标记序列或状态序列
标注问题的目标在于学习一个模型 能够对观测序列给出标记序列作为预测
注意:可能的标记个数是有限的 但其组合所成的标记序列的个数是依序列长度呈指数级增长的

标注问题分为学习和标注两个过程
首先给定一个训练数据集T=(x1,y1),(x2,y2),...,(xN,yN)T=(x1,y1),(x2,y2),...,(xN,yN)
xi=(x(1)i,x(2)i,...,x(n)i)T,i=1,2,...,N,yi=(y(1)i,y(2)i,...,y(n)i)Txi=(xi(1),xi(2),...,xi(n))T,i=1,2,...,N,是输入观测序列yi=(yi(1),yi(2),...,yi(n))T是相应的输出标记序列
n,,,:P(Y(1),Y(2),...,Y(n)|X(1),X(2),...,X(n))n是序列的长度,对不同的样本可以有不同的值,学习系统基于训练数据集构建一个模型,表示为条件概率分布:P(Y(1),Y(2),...,Y(n)|X(1),X(2),...,X(n))
Xi,Y(i),,每一个Xi取值为所有可能的观测,每一个Y(i)取值为所有可能的标记,标注系统按照学习得到的条件概率分布模型,对新的输入观测序列找到相应的输出标记序列

评价指标

评价标注模型的指标与评价分类模型的指标一样,常用的有标注准确率 精确率和召回率
标注常用的统计学习方法有:隐马尔科夫模型 条件随机场
标注应用问题:
自然语言处理中的词性标注
从文章中抽取基本名词短语

回归问题

概述

回归是监督学习的另一个重要问题
回归用于预测输入变量和输出变量之间的关系
当输入变量的值发生变化时,输出变量的值随之变化
实质上:回归模型正是表示从输入变量到输出变量之间映射的函数
回归问题的学习等价于函数拟合:选择一条函数曲线使其很好地拟合已知数据且很好地预测未知数据

回归问题按照输入变量的个数,分为一元回归和多元回归
按照输入变量与输出变量之间关系的类型即模型的类型,分为线性回归和非线性回归
回归学习最常用的损失函数是平方损失函数

参看文献
《统计学习方法》,李航著;

【SCI一区复现】基于配电网韧性提升的应急移动电源预配置和动态调度()—MPS动态调度(Matlab代码实现)内容概要:本文档围绕“基于配电网韧性提升的应急移动电源预配置和动态调度”主题,重点介绍MPS(Mobile Power Sources)动态调度的Matlab代码实现,是SCI一区论文复现的技术资料。内容涵盖在灾害或故障等极端场景下,如何通过优化算法对应急移动电源进行科学调度,以提升配电网在突发事件中的恢复能力与供电可靠性。文档强调采用先进的智能优化算法进行建模求解,并结合IEEE标准测试系统(如IEEE33节点)进行仿真验证,具有较强的学术前沿性和工程应用价值。; 适合人群:具备电力系统基础知识和Matlab编程能力,从事电力系统优化、配电网韧性、应急电源调度等相关领域研究的研究生、科研人员及工程技术人员。; 使用场景及目标:①用于复现高水平期刊(SCI一区、IEEE顶刊)中关于配电网韧性与移动电源调度的研究成果;②支撑科研项目中的模型构建与算法开发,提升配电网在故障后的快速恢复能力;③为电力系统应急调度策略提供仿真工具与技术参考。; 阅读建议:建议结合前篇“MPS预配置”内容系统学习,重点关注动态调度模型的数学建模、目标函数设计与Matlab代码实现细节,建议配合YALMIP等优化工具包进行仿真实验,并参考文中提供的网盘资源获取完整代码与数据。
一款AI短视频生成工具,只需输入一句产品卖点或内容主题,软件便能自动生成脚本、配音、字幕和特效,并在30秒内渲染出成片。 支持批量自动剪辑,能够实现无人值守的循环生产。 一键生成产品营销与泛内容短视频,AI批量自动剪辑,高颜值跨平台桌面端工具。 AI视频生成工具是一个桌面端应用,旨在通过AI技术简化短视频的制作流程。用户可以通过简单的提示词文本+视频分镜素材,快速且自动的剪辑出高质量的产品营销和泛内容短视频。该项目集成了AI驱动的文案生成、语音合成、视频剪辑、字幕特效等功能,旨在为用户提供开箱即用的短视频制作体验。 核心功能 AI驱动:集成了最新的AI技术,提升视频制作效率和质量 文案生成:基于提示词生成高质量的短视频文案 自动剪辑:支持多种视频格式,自动化批量处理视频剪辑任务 语音合成:将生成的文案转换为自然流畅的语音 字幕特效:自动添加字幕和特效,提升视频质量 批量处理:支持批量任务,按预设自动持续合成视频 多语言支持:支持中文、英文等多种语言,满足不同用户需求 开箱即用:无需复杂配置,用户可以快速上手 持续更新:定期发布新版本,修复bug并添加新功能 安全可靠:完全本地本地化运行,确保用户数据安全 用户友好:简洁直观的用户界面,易于操作 多平台支持:支持Windows、macOS和Linux等多个操作系统
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值