
数学建模
文章平均质量分 79
路过的风666
https://github.com/ThePassedWind
展开
-
seaborn/matplotlib/pandas画一些简单乐图(组合图)
文章目录一些设置单簇柱形图+折线图多簇条形图多簇柱形图+折线图堆积柱形图+折线图保存图像一些设置import seaborn as snsimport matplotlib.pyplot as pltimport pandas as pdimport numpy as np%matplotlib inlineplt.rcParams['font.sans-serif'] = ['SimHei'] # 黑体plt.rcParams['axes.unicode_minus'] = False原创 2022-04-07 22:45:45 · 1083 阅读 · 2 评论 -
时间序列数据分析
时间序列数据分析参考知乎文章:时间序列数据分析101,作者:厉建扬除此之外还添加了分类、聚类的评估方法汇总+python实现。文章目录时间序列数据分析1 准备和处理时间序列数据1.1 准备数据集1.2 寻找时间轴1.3 可能遇到的问题1.4 清洗数据1.4.1 缺失值处理1.4.2 改变数据集时间频率1.4.3 平滑数据2 探索式分析(EDA)2.1 针对时间序列的特殊方法2.1.1 理解平稳性2.2 寻找自相关(autocorrelation)3 基于统计学的时间序列分析方法3.1 自回归模型(转载 2021-08-29 17:13:53 · 7830 阅读 · 0 评论 -
数学建模之数据处理
前言:数据预处理是美赛C题最重要的组成部分,十分考验我们对问题的理解与抽象,我们的重心应该放在数据处理而非算法上,算法只需选择合适的即可,无需高大上!下面介绍数模中数据预处理涉及到的一些重要。1.数据获取与目标1.1 数据获取拿美赛C题为例,19年、20年的数据压缩前分别为4.6MB和662.8MB,由此可见美赛的C题对于数据量的要求更高了,除此之外,若我们需要额外的数据集,则需从4中找到合适的网站进行搜索。拿到数据后,一般都是csv或excel文件,我们通常使用python的pandas库进行.原创 2021-01-24 11:35:38 · 10019 阅读 · 0 评论 -
数学建模之流程图和数据可视化
数学建模之流程图及数据可视化前言:数学建模比赛中,最吸引评审老师的就是figure了,figure分为开篇的流程图【模型思路】、数据统计图【折线图、柱状图、扇形图、拟合图…】、地图【热力分布图】。恰恰在美赛中,论文的“颜值”直接取决于各种精美的figure,所以科学储备数据可视化相关的能力是十分必要的,接下来总结一下自己的可视化方法以及相对应美赛O奖论文中的figure展示。1.流程图特别是在美赛的时候,流程图是不可或缺的!大概是放在模型的建立部分,在此图中,我们需要表达出论文的整体思路框架,让评原创 2021-01-21 01:09:32 · 16034 阅读 · 4 评论 -
pandas dataframe数据处理
pandas数据处理前言2020年10月有幸进入了大数据这边学着做项目,即笔者在数据挖掘领域的起点,从此开始了漫长的数据处理以及机器学习的项目实战,为了方便队友以及朋友们的数学建模知识储备,将此过程中所学所用整理于此(部分为实战代码)pandas----yyds数据的读取与写入一般我们的数据集的存储形式为excel、csv。读取######读取一个csv文件,得到一个dataframe# 在服务器上的home目录下读取(服务器的jupyter notebook上操作)bad_dat原创 2020-11-07 23:17:42 · 1447 阅读 · 4 评论 -
数学建模之Hermite插值法和三次样条插值法(附上详细的matlab代码)
插值算法一般定义若P(x)为次数不超过n的代数多项式,即P(x)=a0+a1x+...+anxnP(x)=a_0+a_1x+...+a_nx^nP(x)=a0+a1x+...+anxn若P(x)为分段多项式,即分段插值若P(x)为三角多项式,即三角插值(一般用到傅里叶变换等复杂的数学工具)拉格朗日插值法在若干个不同的地方得到的观测值,拉格朗日插值发可以找到一个多项式,恰好在各个观测点取到观测值。拉格朗日插值函数:(存在缺陷)Ln(x)=∑i=0nyi(∏j=0j≠inx−xj原创 2020-07-09 00:31:19 · 14201 阅读 · 0 评论 -
数学建模之pearson、spearman相关系数
相关系数用来衡量两个变量之间 的相关性大小。根据数据满足的不同条件,选择不同的相关系数来计算分析。总体和样本总体:考察对象的全部个体样本:从总体数据中抽取一部分个体皮尔逊pearson相关系数(线性+近似正态分布)注意:只是用来衡量两个变量线性相关程度,在说明相关性时,必须绘制散点图,加上该系数的值才能说明相关性的程度,原因如下:(1)非线性相关也可能导致pearson相关系数很大(2)离群点对pearson相关系数的影响很大(3)即便是pearson相关系数为0,只能说不是线性相关原创 2020-06-27 15:37:57 · 3792 阅读 · 0 评论 -
数学建模——熵权法(附上实战的详细代码、具体注释以及运行结果)
熵权法——客观计算权重引入:由于层次分析法的主观性太强,判断矩阵的确定依赖于专家(事实上比赛时都是靠自己的感觉来),自己的主观判断对结果的影响是很大的,故引入熵权法,更加客观的计算权重。理解:基于一组数据,方差越小,说明该数据的相似度越大,我们可以判断其优劣的贡献度越小。极端的来看,某项指标,每个对象的得分相同,数据的相似度达到最大,则判断哪个对象较好是没有必要的,即说明这个指标的权重为0.原理:在信息论中,熵是对不确定性的一种度量。不确定性越大,熵就越大,包含的信息量越大,对应的权重越低;原创 2020-06-13 17:43:28 · 50790 阅读 · 47 评论 -
matlab的必记操作
matlab的必记基本操作% 1、多行注释:选中要注释的若干语句,快捷键Ctrl+R% a = 3;% a = 5% 2、取消注释:选中要取消注释的语句,快捷键Ctrl+T% 3、clear可以清楚工作区的所有变量/clc可以清除命令行窗口中的所有文本,让屏幕变得干净clear,clc;% 4、disp()是屏幕输出函数,类似于c语言中的printf()函数a = [1,2,3] % 同一行中间用逗号分隔,也可以不用逗号,直接用空格a = [1 2 3]disp(a);原创 2020-06-05 17:09:39 · 306 阅读 · 0 评论 -
拉依达准则——(3σ)
拉依达准则——(3σ)引言有时在数据分析上,需要对某些偏离点进行剔除,我们可以考虑拉依达法则(3σ),以提高数据的准确性。概念假设一组检测数据只含有随机误差,对其进行计算处理得到标准偏差,按一定概率确定一个区间,认为凡超过这个区间的误差,就不属于随机误差而是粗大误差,含有该误差的数据应予以剔除。这种判别处理原理及方法仅局限于对正态或近似正态分布的样本数据处理,它是以测量次数充分大为前提。此方法对于数据量较小的数据集是不可靠的,需要选择其他方法进行剔除偏离点。使用原理在正态分布中σ代表标准原创 2020-06-05 01:08:43 · 27950 阅读 · 9 评论 -
线性规划(matlab篇)
线性规划1、所有线性规划问题化成matlab中规定的标准形式:f, x, b, beq, lb, ub为列向量,其中f为价值向量,b为资源向量,A,Aeq为矩阵。2、linprog函数上述对应Matlab中的求解命令为:[x,fval] = linprog(f,A,b)[x,fval] = linprog(f,A,b,Aeq,beq)[x,fval] = linprog(f,A,b,Aeq,beq,lb,ub)x返回决策向量的取值;fval返回目标函数的最优值;f为价值向量;A、原创 2020-05-31 00:54:21 · 24488 阅读 · 3 评论