- 博客(49)
- 收藏
- 关注

原创 【机器学习03】神经网络的反向传播 梯度函数求解
神经网络的反向传播(Backpropagation)是一种通过计算损失函数梯度来调整网络权重的算法,是训练深度学习模型的核心方法。
2025-03-26 20:38:07
2092
原创 【注意力机制学习-01】-什么是语言模型中的注意力?
**自注意力(self-attention)** 最早在开创性论文 *Attention Is All You Need* 中被提出,该论文的多位作者之一正是 Cohere 的联合创始人 Aidan Gomez。**注意力机制是一种非常巧妙的方法,能够根据上下文区分单词的不同含义,从而将普通的词嵌入转换为**“**上下文相关的词嵌入**”(contextualized word embeddings)。
2025-04-03 09:27:18
587
原创 【读论文10】-贝叶斯-TCN 滑坡位移预测
针对现有滑坡位移预测模型的不足,并结合研究区滑坡物理机制的动态演化特征,本文提出了**一种基于贝叶斯优化-时序卷积网络(Bayesian optimization-temporal convolutional networks, BO-TCN)**的新型预测模型。该模型能够对复杂的多变量时间序列数据集进行自动特征提取,在训练过程中有效避免未来数据泄漏。同时,它利用贝叶斯优化来寻找模型的最优超参数,从而提供额外的超参数调优过程解析。
2025-04-02 10:15:31
185
原创 【机器学习练习 4】 - 神经网络反向传播-ML-Exercise4
对于这个练习,我们将再次处理手写数字数据集,这次使用反向传播的前馈神经网络。 我们将通过反向传播算法实现神经网络成本函数和梯度计算的非正则化和正则化版本。 我们还将实现随机权重初始化和使用网络进行预测的方法。
2025-04-01 21:12:05
508
原创 【读论文09】-时空预测-STGCN - SBAS-InSAR
现有预测方法通常依赖点采样数据,忽略了滑坡演化中的异质性。为此,我们提出将<font color="#ff0000">时空图卷积网络(STGCN)</font>与<font color="#ff0000">合成孔径雷达干涉测量(InSAR)</font>相结合,以捕捉滑坡事件的时空特征。STGCN 通过图神经网络(GNN)层处理空间特征,并利用门控循环单元(GRU)层分析时间动态,从而更精确地提取与滑坡相关的位移特征。
2025-04-01 09:34:18
24
原创 【机器学习练习 3】 - 一对多(One-vs-All, OvA)逻辑回归
这段代码实现了一对多(One-vs-All, OvA)逻辑回归,用于多分类问题。
2025-04-01 00:30:00
667
原创 【机器学习23】- Additional Neural Network -例如CNN
• 窗口大小=20,步长=10 → 生成9个片段(x₁-x₂₀, x₁₁-x₃₀, …:窗口=信号周期长度/2,步长=窗口/2(图3中窗口20≈100/5)。• 若使用5个滤波器(a₁₁-a₁₅),输出特征图维度=9×5=45。:局部感受野(图2),每个神经元仅处理前层部分输入,降低计算量。• 卷积参数:参考图3的窗口设计(x₁-x₂₀覆盖关键波形)。• 滤波器数量:5个捕捉多尺度特征(图3中a₁₁-a₁₅)。:1D时序信号(100个数据点,高度=1)。高效处理时序/图像数据(图1-图3)。
2025-03-31 15:59:27
705
原创 【机器学习21】-多标签分类(Multi-label Classification)
【机器学习21】-多标签分类(Multi-label Classification)
2025-03-31 15:20:32
364
原创 # 【机器学习-20】-数值计算误差、逻辑回归/Softmax的数值稳定性优化、以及TensorFlow实现细节
数值计算误差、逻辑回归/Softmax的数值稳定性优化、以及TensorFlow实现细节
2025-03-31 15:14:36
880
原创 【机器学习-16】-NumPy数组、张量tensor、神经网络计算公式
以下内容的整合解释,涵盖NumPy数组、激活向量、神经网络模型和前向传播的核心概念和公式
2025-03-31 11:11:28
580
原创 【读论文08】-时空预测-STGCN-微震
在本研究中,我们<font color="#ff0000">首次将时空图卷积网络(STGCN)</font>应用于深部煤炭能源开采诱发的 MS 事件的 TEL 预测。这是图卷积网络(GCN)首次在 MS 事件的时空预测中得到应用。我们基于 MS 传感器之间的距离构建了传感器网络的邻接矩阵,并利用 GCN 提取图的时空特征。该模型简单且通用。
2025-03-31 09:26:44
422
原创 【机器学习-15】 - 神经网络
神经网络(Neural Network)是一种模仿生物神经元工作方式的**机器学习模型**,由多层互联的“神经元”(数学函数)组成,能够通过数据学习复杂的非线性关系。
2025-03-31 01:30:00
817
原创 【机器学习练习 2】 - 逻辑回归
这个笔记包含了以Python为编程语言的Coursera上机器学习的第二次编程练习。请参考 逻辑回归作业详细描述和方程。在这一次练习中,我们将要实现逻辑回归并且应用到一个分类任务。我们还将通过将正则化加入训练算法,来提高算法的鲁棒性,并用更复杂的情形来测试它。
2025-03-30 19:20:46
621
原创 【机器学习总结】- 第一周
本周学习了机器学习部分基础知识点,记录了14 篇学习笔记,并进行了 2 个实战练习,涵盖了**代价函数、优化算法、神经网络、特征工程、模型正则化及分类任务**等核心概念。
2025-03-30 15:57:48
596
原创 【论文阅读-学习总结】- 第一周
本周共阅读了 7 篇论文,主要围绕**时空预测模型**展开,聚焦于图神经网络(GCN)、长短期记忆网络(LSTM)、门控循环单元(GRU)以及注意力机制等方法在滑坡预测中的应用。
2025-03-30 15:13:14
11
1
原创 【读论文-07】-GCN-LSTM-滑坡位移预测
论文提出了一种结合**图卷积网络(GCN)** 和 **长短期记忆网络(LSTM)** 的混合模型(GCN-LSTM),用于预测滑坡引起的累积变形。
2025-03-30 10:15:30
513
原创 【读论文06】-局部对齐卷积神经网络-LACNN
我们提出了一种名为 **Locally Aligned Convolutional Neural Network(LACNN)** 的模型,该模型能够**沿着地表在多个尺度上对齐**,以预测某个单点的滑坡发生概率。 为了验证我们的方法,我们创建了一个**标准化的地理参考数据集**,包含**多种异构特征**作为输入,并与多个基线模型(**线性回归、神经网络和普通卷积网络**)进行比较。我们使用 **负对数似然误差(log-likelihood error)** 和 **受试者工作特征曲线(ROC 曲线)
2025-03-30 05:30:00
699
原创 【机器学习10】-逻辑回归代价函数
逻辑回归的代价函数采用交叉熵损失,定义为所有样本损失的均值。该函数是凸函数,保证了优化过程中梯度下降能够收敛到全局最优解,同时它等价于负对数似然函数的均值,使得最小化代价函数等同于最大化数据的似然估计。
2025-03-29 18:55:17
711
原创 【机器学习-09】-逻辑回归 (Logistic Regression)-分类问题
逻辑回归 虽然带有回归两个字实际上是<font color="#ff0000">分类</font>。它是用于处理二分类问题的监督学习算法。在二分类问题中,输出变量的取值是两个类别之一,通常表示为0和1,其中1表示正类,0表示负类。在这个练习中,我们将实现逻辑回归并应用于两个不同的数据集。
2025-03-29 17:10:39
911
原创 【机器学习-08】特征工程 的 选择
本章直观地展示了新的**特征工程(Feature Engineering)**生成:**通过转换(transforming)或组合(combining)原始特征生成新特征,以提升模型性能**。
2025-03-29 16:40:28
231
原创 【机器学习-07】-Batch Size的选择
Batch Size是深度学习和机器学习中的一个重要概念,指的是在每次训练迭代中一次性输入到模型中的样本数量。它是训练过程中的一个超参数,直接影响模型的训练速度、内存使用以及模型的收敛性。
2025-03-29 16:40:09
683
原创 【读论文05】-时空预测 T-GCN / A3T-GCN
本文以Tangjiao 1#滑坡为例,基于图卷积网络构建了两个滑坡位移预测时空模型。首先,将监测系统转化为全连接图(FCG)并表示为邻接矩阵;其次,建立基于图卷积网络的T-GCN和A3T-GCN时空预测模型,预测唐角1#滑坡的位移;再次,利用MAE、MAPE和RMSE分析模型的预测性能,并与GRU模型进行比较。最后,讨论了所提模型的有效性。
2025-03-29 09:59:39
846
原创 利用pycharm将 ipynb 文件转换为markdown、html、python等文件
利用pycharm(python)将 ipynb 文件转换为markdown、html、python等文件
2025-03-29 08:28:37
211
原创 【机器学习-05】-激活函数的选择-神经网络使用激活函数的必要性
归纳了不同场景下的激活函数选择规则:Sigmoid• 公式:σ(z)=11+e−z\sigma(z) = \frac{1}{1 + e^{-z}}σ(z)=1+e−z1• 特点:输出概率,适合二分类最后一层。• 示例:Linear• 公式:f(z)=zf(z) = zf(z)=z• 特点:无变换,直接输出线性值,适合回归任务。ReLU (Rectified Linear Unit)• 公式:ReLU(z)=max(0,z)\text{ReLU}(z) = \max(0, z)ReLU(z)=
2025-03-29 07:15:00
1556
转载 Deep Learning Tuning Playbook(中译版)
这份文件是为深度学习模型性能极为感兴趣的工程师和研究人员(包括个人和团队)准备的。我们假设其有一定机器学习和深度学习概念及基本知识。我们的重点是超参数调整过程。同时也触及了深度学习训练的其他方面,如管道实现和优化,但对这些方面的讲述并不完整。我们假设机器学习问题是一个监督学习问题或看起来很像一个问题的东西(如自监督)。也就是说,本文中的一些建议可能适用于其他类型的问题。
2025-03-28 21:42:56
36
BP神经网络练习题数据集
2025-04-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人