- 博客(43)
- 问答 (3)
- 收藏
- 关注
原创 扩散模型与普通回归模型进行预测的原理以及误差分析
扩散模型通过从“全噪声”到“清晰预测”的逐步去噪过程,内建了一个纠错机制,使得每一步都在尽量减少和修正误差。这种方法避免了传统直接预测方法那种错误一旦出现就会不断累积扩大的问题,从而在长时间预测中表现得更稳定、更可靠。
2025-03-20 14:06:47
290
原创 模型过拟合问题
防止过拟合是模型训练中的核心问题,特别是在 PINN 中,由于物理约束和稀疏数据的特点,过拟合可能导致对物理规律的偏离。通过数据增强、正则化、改进损失函数、分域方法等手段,可以有效缓解过拟合,提高模型的泛化能力和物理一致性。是指模型在训练数据上表现很好(误差低),但在测试数据或真实场景中表现很差(误差高)。这通常是因为模型学到了训练数据的噪声或特定模式,而不是学习到真正的规律。在机器学习或物理信息神经网络(PINN)中,
2025-01-04 15:58:23
981
原创 最小二乘有限差分的物理信息神经网络与物理信息神经网络的区别
物理信息神经网络(Physics-Informed Neural Network, PINN)是一种结合神经网络与物理规律的新型计算方法,广泛应用于解决偏微分方程(PDEs)相关问题。最小二乘有限差分的物理信息神经网络(LSFD-PINN)是对PINN的一种改进,其主要区别在于。通过LSFD-PINN方法,解决了标准PINN在效率和高阶导数计算上的瓶颈,同时增强了其在复杂问题(如高雷诺数流动)的表现能力,是一种更高效、更精确的改进版本。,并因此在计算效率和适用性方面有所提升。以下用一个简单的例子来对比。
2025-01-04 13:50:04
766
原创 初始数据集-数据处理1
通过切片操作提取X_star中的第二列(即 yyy 坐标),并保持原来的二维结构。如果使用1索引,返回的将是一个一维数组;使用1:2的切片方式,返回的是一个二维数组。
2024-12-20 19:35:57
444
原创 RANS(Reynolds-Averaged Navier-Stokes) 湍流模型类型
RANS 湍流模型有多种不同类型,每种模型有其特定的应用场景和优缺点。
2024-12-13 19:40:41
2822
原创 直接数值模拟、雷诺应力模型、大涡模拟这三个与有限差分法(FDM)、FVM等有什么关系
DNS(Direct Numerical Simulation)、雷诺应力模型(RANS, Reynolds-Averaged Navier-Stokes)、大涡模拟(LES, Large Eddy Simulation) 和传统的数值方法如 有限差分法(FDM)、有限体积法(FVM) 都属于流体力学模拟的不同方法,但它们之间的关系体现在模拟的精细度、计算量和所依赖的数值方法上。下面我们逐一分析这些方法之间的关系。DNS、RANS、LES 都是流体力学中的湍流模拟方法,分别针对不同精度和计算资源要求的流动问
2024-12-13 17:02:54
1254
原创 直接数值模拟(DNS)如何求解 Navier-Stokes 方程
NS 方程描述了粘性流体的运动,包括质量、动量和能量的守恒。对于不可压缩流体,NS 方程为:
2024-12-13 17:00:29
2917
原创 VAE(Variational Autoencoder )与β-VAE
输入数据:[1.2, 0.8, -0.5] 被编码器映射到潜在空间的概率分布,而不是一个确定的点。编码器输出均值和标准差,定义了一个高斯分布。使用重参数化技巧,从该分布中采样得到潜在变量 zz。潜在层的输出是一个概率分布,而不是单一的值,允许VAE在潜在空间内探索更多的结构化数据模式。这种概率建模使得VAE具备了生成能力,并且能够在训练过程中获得更强的泛化能力。
2024-11-30 22:49:12
1241
原创 GAN是一种自监督模型那在判别器中,同时输入生成器生成的SR与真实值HR作比较的话,不就是将HR作为SR的标签吗,如何体现自监督学习呢
这是一个非常有趣的问题!GAN(生成对抗网络)的训练虽然包含真实值(HR),但它并不是直接将真实值用作生成器输出(SR)的“标签”。为了说明其自监督特性,我们需要详细分析 GAN 的工作原理,以及如何在训练中体现“自监督”的理念。虽然在 GAN 的训练中使用了真实值(HR),但它的作用更多是为了帮助判别器学习真实分布,而非作为生成器的直接监督信号。:GAN 的损失函数(如对抗损失)并不直接依赖 HR 作为标签,而是通过判别器对真实分布与生成分布之间的差异来间接优化生成器。
2024-11-29 22:58:00
904
原创 torch.randn详细分析
第一维:包含 3 个子张量。-第二维:每个子张量包含 2 个"矩阵块"。- 第三维:每块包含 4 行。- 第四维:每行包含 5 个元素。
2024-11-29 17:25:04
1287
原创 分析JHTDB数据库的Channel5200数据集的数据(SciServer服务器)
从 JHTDB 请求特定时间和空间位置的速度数据。使用getData()方法进行查询。输出每个查询点的速度结果,方便用户查看和验证。同理,这段代码获取的压力值这段代码获取的速度和压力值说明调用函数来获取速度梯度数据。:表示要获取速度梯度信息。遍历result数组,并格式化输出每个点的速度梯度。result[p]包含当前点的速度梯度,排列方式为,分别表示速度分量 u、v、w 在 x、y、z方向上的偏导数。获取速度的二阶导数说明result。
2024-11-28 22:36:55
1273
原创 读取HDF5 文件注意事项
允许对 HDF5 数据进行切片读取(如 `file[dataset_name][0:10]`),提高了对部分数据的访问效率。如果只想直接读取整个数据集,`[()]` 和 `[:]` 都可以,但语义上 `()` 更清晰。作用:将 HDF5 数据集 `dataset_name` 的所有数据读入内存。作用:从 HDF5 数据集 `dataset_name` 中切片读取所有数据。使用 `()` 读取整个数据集,会将数据直接转换为一个 NumPy 数组。`[:]` 读取数据集所有切片,实际上等价于读取整个数据集。
2024-11-28 22:34:41
448
原创 常见的上、下采样方法
常见的上采样方法反卷积(Deconvolution)或转置卷积(Transpose Convolution):通过学习可逆卷积核来进行上采样,增加特征图的尺寸。 插值(Interpolation):包括最近邻插值、双线性插值等,通过插值算法对特征图进行填充和插值,从而增加尺寸。常见的下采样方法最大池化(Max Pooling):将原始特征图划分为不重叠的小区域,在每个区域中选择最大值作为采样点,从而减小特征图的尺寸。 平均池化(Average Pooling)
2024-11-28 22:34:00
321
原创 迁移学习和无监督学习是什么
迁移学习和无监督学习都是机器学习中的重要方法,它们在湍流速度场超分辨率重建任务中有着独特的作用。让我们通过简单的语言和例子来解释它们如何帮助解决这个问题。
2024-11-28 22:28:26
483
原创 h5py文件的相关操作(二)
方法 1(合并坐标和压力数据)适用于需要一次性访问所有信息的情况,数据结构较为简单。方法 2(分别存储坐标和压力数据)适用于需要灵活操作和管理坐标与压力数据的情况,便于对不同数据集进行独立处理。
2024-11-27 19:25:54
384
原创 h5py文件的相关操作(一)
一、h5文件创建读取操作及参数介绍h5py.File在创建或打开 HDF5 文件时,除了模式参数(如'w''r'等)外,还支持其他参数。
2024-11-27 19:11:04
1355
原创 压缩感知理论
在你的描述中,“选择Haar小波基函数对不同雷诺数下的湍流速度场云数据进行离散小波变换(DWT)”这一过程属于数据的稀疏表示或压缩阶段,但小波变换同时也是信号重构的重要工具。1. 小波变换是数据压缩还是重构?离散小波变换(DWT)将湍流速度场数据从原始域(通常是空间域)转换到小波域。在小波域中,数据被分解为一系列低频和高频成分:低频部分表示信号的主要结构或全局特性。高频部分捕捉信号的细节或局部变化。对于稀疏信号,在小波域中,高频部分通常有许多接近零的系数,可以舍去,从而实现数据压缩。
2024-11-23 20:31:07
1859
原创 PointNet模型中第二个 T-Net与第一个 T-Net 的区别是什么
3. **结合整体与局部信息**:模型通过拼接整体特征和局部特征,将两者结合起来,这样它不仅知道点是“车顶的一部分”,还知道该点的具体位置和周围的结构关系。模型之所以能计算每个点的速度和压力,是因为它从数据中学会了“看到”整个点云的形状和每个点的局部细节,并结合这两者的信息进行预测。- 第一个 T-Net(输入 T-Net):处理的是输入的原始点云数据 (x, y, z),它的作用是对输入的点云进行空间变换,使数据在 3D 空间中对齐和规范化,类似于把一个歪斜的物体摆正,便于后续处理。
2024-11-21 16:27:46
525
原创 Galerkin-type Attention与传统的自注意力机制的区别
在传统的自注意力机制和 Galerkin-type Cross Attention 中,( K^T cdot Q ) 和 ( K^T cdot V ) 所产生的矩阵在本质上有不同的含义,分别表征了注意力机制中“匹配”与“聚合”的两种不同作用。- 计算流程的简化:Galerkin-type Cross Attention 的 ( K^T cdot V ) 通过提前聚合编码器信息,省去了直接计算 ( Q cdot K^T ) 的步骤,使得模型在处理大型序列或复杂数据时更加高效。
2024-11-21 16:25:21
1015
原创 b站小土堆PyTorch视频学习笔记(二)
Dataloader:提供不同类型的数据集;为后面的网络提供不同的数据形式。Dataset:提供一种方式去获取数据及其label(标签){如何获取每一个数据及其lable;告诉我们总共有多少数据}
2024-10-31 17:59:47
288
原创 张量转换代码解析
的作用是将一个包含多个张量的列表all_slices组合成一个新的多维张量。假设all_slices是一个包含多个形状相同的张量的列表,例如会在新维度上将它们组合起来,生成一个新的张量,形状变为,其中N是all_slices中的张量数量。:在新的第一个维度上叠加每个张量,生成。最终的形状会多一个维度。这行代码的作用是创建一个指定形状的 PyTorch 张量,并用特定的值填充它。
2024-10-31 17:57:41
665
原创 b站小土堆PyTorch视频学习笔记(CIFAR10数据集分类实例)
池化是压缩特征:降低特征的数据量/剔除冗余,取池化核对应格子中最明显的一个格子(比如通过池化可以将4k画质变为720P画质)from model_tudui import *:指调用自己创建的model_tudui.py文件中的模型。卷积是提取特征:通过卷积核提取特征(卷积核的个数=out_chennl数;8.进行一次全连接:输入为1024压缩为64。9.进行第二次全连接:输入为64压缩为10。进一步优化:可以让模型 保存,并且显示测试集的正确率。输入层的图片:3通道,像素个数/大小:32*32。
2024-10-31 17:56:47
483
原创 b站小土堆PyTorch视频学习笔记(一)
(1)dir()函数:是一个打开工具,能让我们知道工具箱以及工具箱中的分隔区里面有什么东西。前后带下划线是一种规范,表明这个变量你不可以去篡改它(即私有函数)(2)help()函数:说明书,可以看到任何工具的使用方式。上面输出只显示一行,可以点击下图第二列第一行的操作按钮。通俗来讲,pytorch是一个工具包,里面有很多工具。输出的是torch里面的东西。pytorch是什么。
2024-10-16 21:14:55
255
原创 机器学习与【流体力学】相关应用
湍流建模:湍流是流体力学中最复杂的问题之一。传统的湍流模型(如RANS和LES)虽然有效,但计算成本高。机器学习可以通过训练深度神经网络(如卷积神经网络、长短期记忆网络等)来预测湍流的特征,从而降低计算成本。降维和加速模拟:将高维的流场数据通过自编码器等方法降维,减少计算量,同时保持模拟精度。机器学习还能用于替代部分数值计算步骤(如Poisson求解),加速整体模拟过程。
2024-09-28 14:43:46
1237
原创 Python——pandas库
data:一组数据,例如:ndarray(多维数组),series(一维数组),lists(列表),dict(字典)等等。删除列:使用del df['column_name']或dfdrop('column_name', axis=1)。查看特定列的数据:使用df['column_name']或dfcolumn_name。选择多列数据:df[['column1', 'column2']]。保存为CSV文件:使用dfto_csv('file_path')。文件导入数据:使用pdread_excel()函数。
2024-09-22 19:41:11
843
原创 Python——numpy库与random库
它为处理大型多维数组和矩阵提供了高效的工具,并包括了许多高性能的数学函数,可以广泛用于数据分析、机器学习、数值模拟等领域。1、列表为python的基本数据结构之一(列表、字典、元组等);(2) Tuple 固定的数组,一旦定义后,其元素个数是不能再改变的。(1) list 普通的链表,初始化后可以通过特定方法动态增加元素。(2) Dictionary 词典类型, 即是Hash数组。,可以使用NumPy库的array()函数将列表转换为数组。2、列表可以存储任何类型的数据,数组只能存储单一类型的数据。
2024-09-22 19:18:47
574
原创 机器学习各类库的安装以及使用(小白教程一)
`random_state`:随机种子,设置random_state的值为固定数,可以保证每次划分的结果一致。即其取值不变时,每次运行代码划分得到的结果一模一样,其值改变时,划分得到的结果不同。若不设置此参数,则划分结果是随机的每次都不一样,这样可能导致得到的训练结果不同。这个函数接受输入数据(特征)和输出数据(标签),并将它们随机拆分为两个部分:训练集和测试集。- `test_size`:测试集的比例或绝对数量,通常是小数(如 0.25 表示 25%)或整数(如 1 表示一个样本)。
2024-09-20 20:45:51
664
原创 机器学习(一)
机器学习是人工智能的一个分支,旨在通过数据和经验自动改进算法性能。它使计算机能够识别模式、做出决策和进行预测,而无需明确的编程指令。监督学习是一种机器学习方法,在这种方法中,模型通过输入数据与相应的输出标签之间的映射关系进行训练。监督学习的目标是学习一个函数,该函数可以根据新的输入数据预测相应的输出。
2024-09-20 19:53:15
566
原创 基于C语言的超市系统(一)
超市形态具有种种优点,但在目前状况下,它仍存在零售业企业所共有的落后的一面,如:不能有效地管理每种商品,收款结算速度慢,容易出现营业差错,不宜进行商品调价,盘点效率低等,而且在超市日常管理中,商品的进、销、存等决策以经验为主,缺乏实时分析功能,管理人员对及时传递资料的要求始终得不到满足。根据上述系统分析的结果,确定主程序的流程、各模块之间的层次(调用)关系,说明程序中关键部分所采用的数据组织方式、程序控制结构、数据库表结构以及尽可能高效的算法设计方案(尤其在数据量很大或需要考虑的步骤过多时)。
2024-09-12 17:44:14
875
原创 【图书管理系统】——需求分析文档
1.系统获取或者保存图书信息时,出观系统故障,例如网络故障,数据库服务器故障,系统弹出系统异常页面,提示导入图书信息失败;8、还书操作时,出现系统故障,例如网络故障,数据库服务器故障,系统弹出系统异常页面,提示借书失败。(1)管理用户:读者信息的增加、修改、查询、删除,包括借阅图书编号、借书数量、借书期限、姓名。(2)借书:借书信息输入、修改、查询,包括图书编号、读者姓名、借书日期、借书期限、备注。(3)还书:还书信息输入、修改、查询,包括图书编号、读者姓名、还书日期、备注。
2024-09-09 19:48:10
1354
原创 【图书管理系统】——体系结构设计规格说明书
本系统共建立4个表来存储数据,分别是借阅者、图书、图书管理员、借阅记录。系统的总体设计提出要求,同时它还将作为该产品详细设计与开发的重要参考依据。(1)使用系统一个月的图书管理员进行登记图书的效率要达到10本图书/分钟。(1)在客户端与服务器通信时,如果网络故障,系统不能出现故障。只允许经过注册和登录的用户使用,非登录用户只能访问系统。(1)在系统的图书数据发生变化时,系统能够及时更新。(2)系统应该按照用户身份验证用户的使用权限。数据库表的逻辑结构关系如图5-1所示。管理员界面,借阅者界面,游客界面。
2024-09-09 19:37:11
1288
原创 Linux及Shell编程(一)
(1) 练习调度启动进程的方法,包括at命令、crontab命令及其配置文件。(3)练习与用户管理相关的几个命令,包括whoami、who、w。(1) 利用top、free、df命令查看系统状态。(2)练习管理用户的工具,主要是图形界面管理工具。(2) 利用图形界面的系统监视器查看系统状态。1.根据教材练习Linux的用户管理方法。3.根据教材练习Linux的进程管理方法。(2) 利用ps命令查看进程的相关信息。(3) 利用kill命令停止进程。(1) 查看与用户相关的配置文件。4.监视linux系统。
2024-09-09 19:13:06
253
原创 Structured Streaming基于股票值分析(pyspark版)
本实验将股票数据进行过滤处理然后使用socket源将初始数据发送到客户端通过structured streaming累计计算求股票平均值分别计算出MA10、MA40,然后将两种平均值进行比较判断买入卖出的情况。本次实验中成功使用Socket源发送数据给客户端,然后客户端处理数据,实现了股票买入卖出的分析,并展示了股票的变化趋势。将MMA40.py文件放到虚拟机上进行MA40数据处理。将MMA10.py文件放到虚拟机上进行MA10数据处理。需要对数据进行过滤处理仅保留日期和最终股票值。...
2022-08-17 15:08:42
539
空空如也
如何解决这个错误哇,根据网上的方法都不能解决
2021-11-16
搭建hadoop集群时,格式化失败
2021-11-05
逆序建立链表中struct node* creat(int n);什么意思
2020-03-15
TA创建的收藏夹 TA关注的收藏夹
TA关注的人