数学建模学习笔记

原创

已于 2024-08-28 10:01:46 修改 · 1.6k 阅读

47 ·

CC 4.0 BY-SA版权

文章标签：

#数学建模 #学习 #笔记

于 2024-08-08 08:45:06 首次发布

数学建模学习笔记

现学现卖，随缘更新QwQ
主要根据b站大师兄的视频整理而成，有不懂的可以去看原视频

List

数学建模学习笔记
一、层次分析法
- 1.1 矩阵的一致性及其检验
- 1.2 权重计算
- 1.3 具体流程
二、模糊综合评测
- 2.1 隶属函数
- 2.2 隶属函数的确定方法
- 2.3 模糊综合评测
三、熵权法
- 3.1 正向化与标准化
- 3.2 流程
四、TOPSIS优劣解距离法
五、灰色关联分析
- 5.1 前置定义
- 5.2 流程
六、线性规划
- 6.1 基本定义
- 6.2 标准型
- 6.3 整数线性规划
- 6.4 一点补充
七、非线性规划
八、图论与最短路算法
九、网络流模型
十、微分方程
十一、插值与拟合
十二、时间序列
- 12.1 分类及其结合
- 12.2 季节性阻尼趋势模型
- 12.3 平稳性与差分
- 12.4 ARIMA模型
十三、旅行商问题
十四、聚类分析入门
- 14.1 相关性的刻画——距离及其他
- 14.2 聚类分析算法
十五、BP神经网络
- 15.1 组成及结构
- 15.2 学习方式——反馈机制
- 15.3 流程
十六、决策树与随机森林
- 16.1 ID3算法原理

一、层次分析法

1.1 矩阵的一致性及其检验

对于矩阵 $A$ ， $a_{ij}$ 表示第i个因素的重要程度是第j个因素的A[i][j]倍。
若矩阵A满足： $a_{ij}$ * $a_{jk}$ = $a_{ik}$ ，则称A为 一致矩阵，否则称为 不一致矩阵
对于一致矩阵A，有如下 三条性质：

$r ank (A)$ = 1，且唯一非零特征根为n
A的任意列向量都是对于特征根n的特征向量

上述性质告诉我们，只要满足两两行/列成倍数关系，就是一致性矩阵。
对于不一致矩阵，其最大特征根 $\lambda_{max}$ >n， $\lambda$ 与n相差越大，其不一致程度越大。由此，给出一致性检验指标 $C I$ = $\frac{ \lambda_{max} - n} {n-1}$ 其中 $\lambda_{max}$ 表示最大特征值。CI越大，表示一致性越差，越接近0则一致性越好。
由于 $C I$ 受随机因素影响，阶数n越大，该因素越显著。为了衡量 $C I$ 的大小，引入 $R I$ 表示随机一致性指标，并以一致性比例 $CR$ = $\frac{CI}{RI}$ 作为判断依据。若 $CR$ <0.1，则认为判断矩阵的一致性可以接受，否则需要对判断矩阵进行修正，若不满足，则需构造出更多的倍数关系，直至 $CR$ < 0.1

1.2 权重计算

层次分析法的最终目的就是获得不同要素的权重，以便于后续进行加权平均。具体地，先将每一列进行 归一化，也即将 $a_{ij}$ 替换为 $\frac{ a_{ij} }{\sum_{i=1}^{n}a_{ij}}$ ；
然后，对于非一致矩阵，将 $W_i=\frac{\sum_{j=1}^{n}a_{ij}}{n}$ 作为第i个要素的权重。这种求权重的方法称为算数平均求权重。由于一致矩阵各列成比例，所以只需取第一列即可，不需要进行算术平均。
另一种求权重的方式为：将最大特征值对应的特征向量进行归一化，第i个分量的值即为 $W_i$ 。这种方法称为特征值法求权重。
这种方法较于前一种方法更加方便使用，因而在实际比赛和科研中建议使用特征值法。

1.3 具体流程

根据专家意见、问卷调查等方式获得判断矩阵 $A$ ，并对 $A$ 进行一致性检验，若 $CR$ <0.1，认为一致性检验通过，否则构造新的判断矩阵
将判断矩阵各个列进行归一化，随后对每一行求算数平均，所得即为权重

层次分析法是一种主观确定权重的方式，后续还会有客观确定权重的方式——熵权法

二、模糊综合评测

一般的对立集合具有排中律，即“非此即彼”，而对于不满足排中律的情况，则需要引入隶属函数衡量每个元素对于不同集合的隶属度。换句话说，就是对于一个论域 $U$ 构造一个函数 $\rightarrow [0,1]$ ，以评判 $U$ 中每一个元素的隶属度。与层次分析法一样，这种方法也属于主观评价方法。

2.1 隶属函数

对于模糊集合 $A = “ 年轻 ” ， U = (0, 120)$ ，定义隶属函数 $\mu_A$ ：
$\mu_A = \begin{cases} 1，0<x<20\\ \displaystyle\frac{40-x}{20}，20≤x≤40\\ 0，40<x<120 \end{cases}$
可以看到，这个函数对U中每一个元素都给出了一个对于 $A$ 的隶属度，越大则越符合。
模糊集合的表示方法包括扎德表示法，序偶表示法，向量表示法等。
序偶表示法： ${(x_1,A(x_1)),(x_2,A(x_2))...(x_n,A(x_n)\}$
向量表示法： $A=\{A(x_1),A(x_2) ... A(x_n)\}$
当U为无限集时，定义 $A=\displaystyle\int_{x\in U} \frac{\mu_A(x)}{x} dx$

上面例子中 $A = “ 年轻 ”$ 属于极小型，因为值越小隶属度应当越高。对于这类集合，其隶属函数应形如：
$\mu_A = \begin{cases} 1，x<a\\ \displaystyle\frac{b-x}{b-a}，a≤x≤b\\ 0，x>b \end{cases}$
相应地，对于极大型 ，其形式为：
$\mu_A = \begin{cases} 0，x<a\\ \displaystyle\frac{x-b}{b-a}，a≤x≤b\\ 1，x>b \end{cases}$
对于中间型，其左侧为极大型函数，右侧为极小型函数，不作赘述。
上面的构造方法称为梯形型，事实上还存在k次抛物型、柯西型、正态型等等，在需要时可以自行查阅。

2.2 隶属函数的确定方法

确定隶属函数有模糊统计、F分布、三分法等，至少应该满足如下条件：

极小型集合的下界a，小于a的元素均不属于其他集合（极大型同理）
增长趋势应符合主观经验

2.3 模糊综合评测

对于一级模糊综合评价，遵循如下步骤：

确定因素集 $U$ ，例如 {工作业绩、工作态度、沟通能力}，评语集 $V$ ，例如 {好，较好，中，差，很差}
确定各因素（ $U$ 中各个元素）的权重，若无数据可采用层次分析法，若给出数据则使用熵权法的TOPSiS，也可以不确定权重
对每个 $u_i$ ，确定其对于每个 $v_j$ 的隶属度，对指标 $u_i$ 的评判记作： $R=[r_{i1},r_{i2}\dots r_{in}]$ ，其中 $r_{ij}$ 表示 $u_i$ 对于 $v_j$ 的隶属度。
对每一列进行加权平均（即左乘行向量）,取数值最大的评语作为最后综合评判结果

若将评语集更改为方案集，上述流程可以判断出哪个方案最优！此时也可称评语集不带有评价色彩。
类似地，对于因素集中、指标过多时，可根据相关性将因素归纳成一个个小集合，从而进行模糊综合评价的嵌套，也即多级模糊综合评测。

三、熵权法

信息熵是衡量混乱程度的量，其定义为:
$H(X)=\sum_{i=1}^n[p(x_i)I(x_i)]=-\sum_{i=1}^n[p(x_i)ln(p(x_i))]$
其中 $I(x_i)=-ln(p(x_i))$ 表示 $x_i$ 的信息量。根据公式，可以将信息熵理解为对信息量的期望值。信息熵越大，当前状态的混乱程度最大，也即掌握的信息最少（信息的本质就是减少混乱程度，增大确定性），以该指标衡量对象的可靠性越差，信息有效性也就越小。

3.1 正向化与标准化

在应用熵权法之前，要先对数据进行正向化处理。指标大致可分为四类：极小型（越小越好）、极大型（越大越好）、中间型（越接近越好），区间型（落在区间内最好）。我们的目标是将其余三种类型转换为极大型。

将极小型转化为极大型，公式为 $ma x - x$ 或 $\displaystyle\frac{1}{x}(x>0)$ ， $ma x$ 表示该指标下的最大值；
中间型转化为极大型，公式为 $\displaystyle\tilde x_i = 1-\frac{\left|x_i-x_{best}\right|}{M}$ ，其中 $M=max\{\left|x_i-x_{best}\right| \}$ 表示指标下的最大偏差；
区间型转化为极大型，方式类似于中间型隶属函数， $\displaystyle\tilde x_i = \begin{cases} 1-\frac{a-x_i}{M}，x_i<a_1\\ 1，a\le x_i \le b\\ 1-\frac{x_i-b}{M}，x_i\ge b \end{cases}$ ，其中 $M=max\{a-min,max-b\}$ 为最值到边界的最大距离。
对于极大型，若存在负元素，则可将每一个元素替换为 $x - min$

这样，三类数据都可以用极大型指标的方式呈现，且均非负。
随后，为了消除量纲的影响，对每个数据进行标准化。设标准化后的矩阵为 $Z$ ，则 $Z$ 满足： $\displaystyle z_{ij}=\frac{x_{ij}}{\sqrt{\sum_{i=1}^n x_{ij}^2}}$
对每一列再做归一化，得到的矩阵 $P$ 称为比重矩阵

3.2 流程

对数据进行正向化、标准化与归一化，最终得到矩阵 $P$
令信息熵 $e_j=-\frac{1}{\ln n} \sum _{i=1}^{n} p_{ij} \ln (p_{ij})(j=1,2,\dots ,m)$ ，注意这里新增了 $-\frac{1}{\ln n}$ ，以将结果规范到[0,1]之间
由此得到信息效用值 $d_j=1-e_j$ ，再将信息效用值归一化，得到熵权 $W_j = d_j/\sum_{j=1}^m d_j (j=1,2,\dots,m)$