xyzroundo-优快云博客

原创 AI：反向传播算法里程碑论文《Learning representations by back-propagating errors》逐段翻译与精读

我们一起来逐段精读并讲解这篇深度学习的奠基之作——《Learning representations by back-propagating errors》。

2025-12-14 16:24:48 616

原创 AI论文《Learning representations by back-propagating errors》反向传播算法解读

这篇1986年发表在《Nature》上的开创性论文提出了反向传播算法，解决了多层神经网络训练的关键难题。论文通过链式法则计算误差梯度，使网络能够自动学习隐藏层表征，成功解决了XOR等非线性问题。实验证明网络不仅能分类，还能学习抽象关系。该工作复兴了神经网络研究，为深度学习奠定了基础，虽然存在梯度消失等局限，但其核心思想至今仍是训练现代神经网络的标准方法。论文将数学工具创新应用于机器学习，推动了AI从手工特征设计向自动表征学习的范式转变。

2025-12-14 16:12:08 883

原创 AI反向传播的里程碑论文《Learning representations by back-propagating errors》

这篇发表于1986年的论文《Learning representations by back-propagating errors》（通过反向传播误差学习表示），由David Rumelhart、Geoffrey Hinton和Ronald Williams合作完成，是深度学习领域的一座里程碑

2025-12-14 16:10:11 945

原创 AI神经网络中的导数

导数在神经网络中量化了损失函数对参数变化的敏感程度，是反向传播算法的核心数学工具。它通过切线斜率表示函数瞬时变化率，指导参数调整方向与幅度。前向传播中，激活函数的导数影响信号传递；反向传播通过链式法则高效计算各层梯度，实现参数更新。从单变量导数到多变量梯度，导数揭示了损失函数的最速下降方向。现代框架利用自动微分技术简化求导过程，而梯度值还能诊断训练问题（如梯度消失/爆炸）。作为优化基础，导数如同"导航仪"，指引神经网络沿着误差轨迹精准优化参数，是深度学习高效训练的关键所在。

2025-12-14 15:57:27 830

原创 AI：深度学习中反向传播中的链式法则和梯度

反向传播中的链式法则是神经网络训练的核心数学工具，它将复杂的梯度计算分解为逐层的简单计算。通过从输出层误差反向推导各层参数的更新方向，链式法则实现了高效训练。其核心公式将全局导数分解为局部导数的乘积，避免了直接计算高维参数的复杂性。具体应用中，误差信号通过权重矩阵转置逐层反向传播，激活函数导数调控传播强度。链式法则的计算复杂度仅为O(N)，远优于传统方法的O(N^2)，这得益于中间结果的重用。该法则不仅指导理论推导，也是现代自动微分框架的实现基础，使深度学习模型能够沿着误差信号精准调整参数。

2025-12-14 15:55:04 834

原创 AI：深度学习的前向传播和反向传播

深度学习通过前向传播和反向传播实现模型训练。前向传播从输入层到输出层逐层计算，通过线性变换和激活函数生成预测结果并计算损失。反向传播则利用链式法则从输出层反向传递梯度，更新权重参数以最小化损失。二者形成完整迭代循环：前向计算预测，反向优化参数。现代框架通过自动微分简化了反向传播的实现，理解这一机制对网络设计、调试和优化至关重要。

2025-12-14 15:53:57 959

原创 AI 从线性回归到神经网络那些事

我们从简单的线性回归出发，一步步深入到复杂的神经网络，这一演进过程展现了机器学习模型的内在逻辑和发展脉络。通过这条路径，我们可以理解每个环节的必要性和连续性。表：从线性回归到神经网络的核心概念演进模型关键创新解决的问题遗留的挑战线性回归建立特征与目标的线性关系连续值预测无法处理非线性与分类问题逻辑回归使用Sigmoid函数输出概率二分类问题本质仍是线性模型激活函数引入非线性变换拟合非线性关系单层模型表达能力不足神经网络多层非线性变换组合复杂函数逼近。

2025-12-10 23:19:19 851

原创 AI 深度学习神经网络在线演示网站

摘要：本文汇总了多个深度学习神经网络交互式演示网站，帮助初学者直观理解AI概念。包括TensorFlow Playground（基础神经网络）、CNN Explainer（卷积网络可视化）、GAN Lab（生成对抗网络）等工具，涵盖从入门到专业的不同需求。建议初学者从TensorFlow Playground开始，视觉方向学习者使用CNN Explainer，研究者可选用Netron分析模型结构。这些工具通过可视化交互降低学习门槛，使抽象的深度学习原理变得生动易懂。（149字）

2025-11-08 22:26:48 877

原创 AI: 激活函数ReLU

ReLU激活函数是深度学习的核心组件，其定义为f(x)=max(0,x)，具有计算高效（比Sigmoid快6倍）和缓解梯度消失的优势。主要变体包括Leaky ReLU和PReLU，用于解决神经元死亡问题。实际应用中建议配合He初始化，保持30-50%的激活率。ReLU是CNN、Transformer等模型的默认选择，但不适用于输出层。典型问题如神经元死亡可通过Adam优化器、BN层或改用ELU/Swish来改善。

2025-11-08 22:24:24 744

原创 AI神经网络的“灵魂” 常见激活函数 ReLU Sigmoid Tanh

摘要：本文深入介绍了三种常见激活函数（ReLU、Sigmoid、Tanh）的特性与应用。ReLU计算简单、缓解梯度消失，是CNN等现代网络隐藏层的首选；Sigmoid输出(0,1)适合概率输出，但存在梯度消失问题；Tanh零中心化(-1,1)，在RNN中表现较好。文章通过函数公式、导数范围、优缺点对比及可视化代码，阐明了不同场景下的选择策略：隐藏层优先ReLU（或变体），输出层根据任务选择Sigmoid（分类）或线性（回归）。最后简要提及Leaky ReLU等改进方案。（149字）

2025-11-08 21:58:32 523

原创 AI：不同缩放方法对具体模型（如SVM、神经网络）性能影响的对比

数据缩放对SVM和神经网络等机器学习模型性能影响显著。标准化（StandardScaler）对异常值稳健，适合正态分布数据；归一化（MinMaxScaler）在数据范围明确时表现更优但对异常值敏感；RobustScaler抗异常值能力强；Normalizer适用于文本等方向敏感任务。实验表明最佳缩放方法因模型和数据集而异，需通过对比测试选择。关键要避免数据泄露，必须用训练集参数同时转换训练和测试集。标准化通常是稳妥起点，归一化在特定场景更有效，实际需根据数据特性和模型需求选择。

2025-11-07 23:27:06 349

原创 AI训练中的归一化 (Normalization)和标准化 (Standardization)及实现方式

在AI训练中，归一化和标准化是两种关键的数据预处理方法。归一化（如Min-Max Scaler）将数据缩放到指定区间（如[0,1]），适用于输出范围有要求的场景，但对异常值敏感；标准化（如Z-score）使数据均值为0、标准差为1，适用于含异常值或基于距离的算法。Scikit-learn提供MinMaxScaler和StandardScaler等工具实现这两种方法。选择依据包括：1）模型类型（梯度下降类模型需缩放）；2）数据特性（异常值多选标准化）；3）需注意仅基于训练集拟合参数。标准化因鲁棒性较强通常为首

2025-11-07 23:18:14 626

原创 AI训练中的归一化 (Normalization) 和标准化 (Standardization)

数据预处理中，归一化通过线性变换将数据映射到指定区间（如[0,1]），适用于消除量纲差异和加速梯度下降收敛，但对异常值敏感。标准化则通过Z-score变换调整数据均值为0、标准差为1，能表征数据相对位置，适用于假设数据呈正态分布的算法，对异常值更鲁棒。选择方法需考虑数据特性与模型需求：归一化适合数据分布稳定且无极端值的情况，标准化则更通用，尤其适合存在异常值或基于距离的模型。两种技术都能提升机器学习模型的训练效果和性能。

2025-11-07 23:13:32 445

原创 DeepSeek-OCR全面应用指南

摘要 DeepSeek-OCR是DeepSeek AI推出的创新多模态模型，采用"上下文光学压缩"技术实现高效文本处理，在10倍压缩比下精度达97%。该系统支持五种分辨率模式，日处理20万页数据，可识别文档、表格、公式等复杂内容。安装需24GB以上显存GPU和Python 3.12.9环境，提供本地部署和云端服务两种方案。应用场景包括企业文档数字化、学术研究、金融法律等领域，通过提示词工程和批量处理可优化性能。推荐初学者从云端服务体验，企业用户采用Linux服务器部署以获得完整功能。随着

2025-11-03 23:31:58 2376

原创 DeepSeek-OCR：视觉压缩长文本的理论突破与架构解析

摘要： DeepSeek-OCR是DeepSeek AI发布的革命性视觉-文本压缩模型，通过将文本视为连续视觉信号进行高效压缩，突破传统Transformer二次方复杂度限制。其核心架构包括DeepEncoder视觉编码器（3.8亿参数）和MoE解码器（30亿参数，稀疏激活），支持多分辨率动态处理，实现最高20:1的压缩比。训练采用两阶段策略，结合3000万页多语言数据，在文档数字化、知识管理等领域展现显著优势。该技术验证了"视觉作为文本压缩器"的可行性，为LLM长上下文处理提供新范式，

2025-11-03 23:29:18 1211

原创 DeepSeek-OCR 视觉-文本压缩创新多模态模型

摘要：DeepSeek-OCR是DeepSeek AI团队推出的创新多模态OCR模型，采用"视觉-文本压缩"技术实现高效文档处理。其双模块架构包含3.8亿参数的视觉编码器和3B-MoE解码器，支持5种分辨率模式，在10倍压缩率下仍保持97%准确率。该模型突破性地解决了传统OCR的结构保持、多语言支持和复杂内容解析等痛点，支持PDF/图像批量处理并输出结构化Markdown。典型应用场景包括企业文档数字化、学术研究及LLM训练等。该模型已完全开源，提供完整工具链和技术文档，为长文本处理提供

2025-11-03 23:24:00 1062

原创 AI:梯度下降法实现线性回归步骤

梯度下降算法是机器学习中优化模型参数的核心方法，通过迭代调整参数使预测值逼近真实值。其核心思想是沿损失函数梯度反方向更新参数，逐步降低误差。算法实现包括初始化参数、计算梯度、更新参数和迭代优化四个步骤。学习率的选择至关重要，过大会导致震荡，过小则收敛缓慢。梯度下降有三种变体：批量、随机和小批量，各有优缺点。该算法通用性强、效率高，但可能陷入局部最优或鞍点。通过多初始值、自适应学习率和特征缩放等策略可提升性能。梯度下降为线性回归和更复杂模型提供了基础优化框架。

2025-10-23 00:42:32 952

原创 AI机器学习：梯度下降算法实现线性回归的详细解析

本文详细解析了梯度下降算法实现线性回归的原理与过程。首先介绍了线性回归的基本概念和损失函数，然后深入讲解了梯度下降的数学原理和参数更新规则。通过房屋价格预测的具体示例，展示了梯度下降的计算步骤和可视化效果，包括损失函数曲面、参数更新路径和损失值变化曲线。最后提供了Python实现代码，涵盖数据准备、参数初始化、梯度下降迭代和结果可视化等完整流程。文章通过理论推导与代码实践相结合的方式，帮助读者全面理解梯度下降算法在解决线性回归问题中的应用。

2025-10-23 00:40:33 995

原创 SQL Oracle 中，将纵表（行结构存储属性值）转换为横表

Oracle纵表转横表主要有两种方法：1.使用PIVOT子句(Oracle 11g以上)，通过指定属性列和聚合函数(如MAX)实现转换；2.使用条件聚合(兼容所有版本)，通过CASE WHEN语句实现。关键注意事项包括：合理选择聚合函数、处理空值(NVL)、动态列名需用动态SQL。对于属性值不固定的情况，需要构建动态SQL语句。两种方法都需要预先知道要转换的属性值，静态属性可直接转换，动态属性则需额外处理。

2025-10-10 20:04:21 544

原创 Android布局占位view layout_weight layout_height

摘要：文章分析了Android布局中layout_weight属性的核心机制，指出其行为取决于layout_width/height的设置。当设为wrap_content时，系统会先分配内容空间再分配剩余空间，可能导致布局异常。解决方案是将占位View的layout_height改为0dp或使用Space视图替代。最佳实践包括：权重与尺寸搭配使用0dp、避免过度嵌套、明确设置weightSum。掌握这些规律能有效实现自适应布局。

2025-10-10 01:02:16 357

原创 Android布局将按钮左右分开的方案

摘要：针对界面按钮布局需求，提供了三种实现方案对比。方案一（推荐）使用权重+占位视图实现左右分区，简单可靠；方案二采用嵌套LinearLayout使结构更清晰；方案三利用ConstraintLayout实现精准对齐。表格对比了各方案特点，并附具体实现代码，适用于不同开发场景下的灵活布局需求。

2025-10-10 00:59:28 370

原创 Android 分批发送蓝牙数据 MTU请求和服务发现的顺序问题

摘要：优化蓝牙数据传输的关键在于调整操作顺序和增强错误处理。建议在发现服务成功后再请求MTU，并严格检查特征属性是否支持所需操作。关键改进包括：1）将MTU请求移至服务发现后；2）添加特征属性验证；3）完善状态管理；4）在关键操作间加入短暂延迟。这些调整能提升连接稳定性，确保数据可靠传输。代码示例展示了如何实现特征属性检查和状态更新，流程图则清晰呈现优化后的BLE打印数据流。

2025-10-10 00:46:50 1150

原创 Android 典型的 BLE 数据传输限制问题蓝牙发送时被截断

蓝牙BLE传输中JSON数据被截断的解决方案：BLE协议默认单次传输限制为20字节有效数据。解决方案包括：1) 协商更大的MTU（最大247字节）；2) 实现数据分段发送，按MTU大小切分数据；3) 检查特征值属性，选择合适的写入类型；4) 添加传输状态监控。实践建议从测试小数据开始，逐步增加长度，并加入数据校验机制。通过优化传输协议和分段处理，可有效解决BLE数据传输限制问题。

2025-10-10 00:40:27 1031

原创 GIT: git checkout 将文件从 A 分支合并到 B 分支的方法

git中将x文件的所有更新从A分支合并B分支，只包含这个文件的更新，其它提交不合并过去。

2025-09-22 19:47:49 1054

原创 Android:蓝牙设备的标识方式

蓝牙设备可通过多种方式标识：MAC地址（最可靠且唯一）、设备名称（可修改不唯一）、UUID（标识服务）、配对状态和设备类（BLE设备还有额外标识方式）。最佳实践是优先使用MAC地址，辅以设备名称和设备类作为备用识别方式。应用开发中应提供设备选择界面，保存用户选择的打印机的MAC地址和名称，确保可靠连接。

2025-09-21 00:13:50 951

原创 Android应用国际化实现方案

Android支票应用国际化实现方案：通过创建values/strings.xml（英文）和values-zh/strings.xml（中文）资源文件，实现UI文本的多语言支持。方案包含按钮文本、字段提示、标签文本、对话框内容等完整翻译，并配合LanguageManager工具类实现语言切换功能，支持中英文双语切换。货币单位等本地化内容也做了相应适配，确保应用在不同语言环境下都能正常使用。

2025-09-19 01:00:05 352

原创 Android：AndroidManifest.xml 配置对横屏显示的影响分析

AndroidManifest.xml中的configChanges属性配置会影响横屏布局处理方式。当设置了orientation|screenSize|keyboardHidden时，屏幕旋转不会重建Activity，系统也不会自动加载横屏布局(layout-land/)，需要开发者手动处理。解决方案包括：1)移除configChanges让系统自动处理；2)保留配置并在Activity中手动切换布局；3)使用Fragment管理不同方向的布局。建议根据项目复杂度选择合适方案，并确保正确创建layout/

2025-09-19 00:56:14 770

原创 Android:支票应用更换底图功能

支票底图自定义功能实现摘要：支票应用新增照片选择和图片库功能，允许用户自定义支票底图。实现方案包括：添加相机和存储权限配置创建文件提供者和路径配置在布局中添加底图更换按钮实现图片选择逻辑：支持拍照、相册选择和恢复默认底图处理相机和存储权限请求提供选择对话框让用户选择图片来源代码已实现权限检查、图片获取和默认背景恢复功能，为用户提供灵活的背景更换体验。

2025-09-16 00:32:59 599

原创 Android 支票打印功能实现

本文介绍了一个Android支票打印应用的实现方案，包含支票底图加载、字段位置设置、数据填写和蓝牙打印功能。应用采用以下设计：主界面显示支票底图，允许用户拖动调整字段位置（收款人、日期、金额及英文描述）点击字段可编辑内容，长按可拖动调整位置通过蓝牙将字段位置和内容打包为JSON发送至打印设备技术实现包括：使用FrameLayout叠加底图和可拖动TextView 为字段添加红色边框标识实现触摸事件处理拖动逻辑将布局数据转换为JSON格式通过蓝牙Socket传输打印数据该方案提供了完整的用户

2025-09-14 21:25:19 1223

原创 git:本地项目上传到 Gitee怎么做？

本文介绍了两种将本地项目上传到Gitee的方法：克隆后推送（推荐）和本地初始化后推送。表格对比了两种方法的适用场景、步骤和注意事项。详细步骤包括：注册账号、安装Git、配置SSH公钥、创建空仓库、克隆/初始化仓库、提交推送等操作。同时提供了常见问题解决方案，如权限不足、历史冲突等。建议使用.gitignore文件过滤不需要上传的文件，并注意仓库大小限制。两种方法均可实现项目上传，新手推荐使用克隆后推送以避免冲突。

2025-09-14 21:19:37 583

原创芯片：最强的手机芯片对比

当前手机芯片竞争激烈，天玑9400+、骁龙8 Elite和苹果A18 Pro是三大旗舰芯片。天玑9400+采用3nm工艺，安兔兔跑分超305万；骁龙8 Elite配备自研Oryon架构，AI算力45TOPS；A18 Pro单核性能突出，AI算力达200TOPS。AI能力成为新焦点，骁龙8 Gen5预计2025年底上市，跑分近300万。实际体验还需结合系统优化和散热设计。选购建议：追求性能选天玑9400+或骁龙8 Elite，注重生态选A18 Pro，性价比可关注骁龙8 Gen5或上代旗舰芯片。

2025-08-31 21:45:15 8318

原创 Flowable的内部机制 HistoricVariableInstance::getVariableName NullPointerException问题

摘要：当HistoricVariableInstance::getVariableName理论上不应返回null却引发NullPointerException时，可能源于Flowable变量存储机制异常、Collectors.toMap对null值的限制，或流程实例状态问题。解决方案包括添加null检查、处理null值及验证流程实例ID。最佳实践建议采用防御性编程、使用Optional、日志记录和输入验证来预防此类问题。核心措施是在数据转换前进行null过滤，确保Map键值有效，避免NPE异常。

2025-08-31 21:34:35 521

原创 Flowable获取历史表单数据方法

Flowable工作流引擎中，历史表单数据以流程变量形式存储在历史表中，可通过HistoryService接口查询。主要有三种方法：1）使用HistoricVariableInstanceQuery获取所有流程变量；2）通过HistoricDetailQuery查询详细表单提交记录；3）结合历史任务查询特定节点的表单数据。外置表单和文件数据同样适用这些方法，但需注意性能优化和数据类型转换。实际开发中建议根据审计需求选择查询方式，并处理大数据量分页问题。

2025-08-31 21:28:55 883

原创 OCR大模型 dots.ocr PK 主流OCR模型

摘要： dots.ocr是一款创新的端到端OCR大模型，采用统一视觉语言架构（1.7B参数/6GB），支持100+语言和复杂文档解析（表格、公式等）。相比主流OCR，其优势在于：多语言错误率低50%、表格解析TEDS 88.6（超越Surya）、动态任务切换（通过Prompt调整）。部署需20GB显存（RTX 4090/A100），适合学术文献、多语言场景，但存在超高分辨率需降采样、特殊字符敏感等限制。技术选型上，dots.ocr在综合性能领先，而PaddleOCR（轻量化）、EasyOCR（快速集成）、S

2025-08-18 22:22:09 1881

原创主流开源OCR模型对比

开源OCR大模型选型指南主流OCR工具各具特色：Tesseract支持100+语言，适合多语言印刷体；PaddleOCR中文识别最强，专精证件/表格处理；EasyOCR多语言快速部署；GOT-OCR 2.0支持公式/图表多模态解析；Surya擅长复杂表格识别；olmOCR专注PDF结构化解析；Umi-OCR满足离线轻量需求。选型需结合场景：中文优先PaddleOCR，学术文献选GOT-OCR/olmOCR，移动端用Umi-OCR，多语言考虑EasyOCR/Tesseract。未来趋势聚焦多模态融合与端到端

2025-08-18 22:19:46 4612

原创开源OCR大模型dots.ocr的全面解析

摘要： dots.ocr是小红书Hi Lab团队开源的多语言OCR模型（1.7B参数），采用视觉语言模型架构实现端到端文档解析，支持100+语言、表格/公式提取和结构化输出。性能上，其表格解析（TEDS 88.6%）和低资源语言处理优于Gemini、PaddleOCR等主流模型，但需20GB显存。适用于学术文献、金融报表等复杂场景，虽在超高分辨率图像和特殊字符处理存在局限，但以轻量化参数实现高效多任务整合，推动OCR技术向高效架构发展。开源地址可获取模型及在线体验。（注：摘要严格控制在150字内，涵盖核心

2025-08-18 22:17:08 3745

原创点积、线性变换、矩阵乘法与几何空间通过投影与对偶性紧密相连

本文从几何角度解析了点积、线性变换与矩阵乘法的本质关联。点积的物理意义体现为投影操作与尺度变换的复合，其符号反映向量方向关系。点积运算等价于高维空间到一维的线性变换，这种对偶性揭示了一维变换均可表示为与某固定向量的点积。矩阵乘法本质是线性变换的复合，而行列式则量化了变换对空间的体积缩放与定向改变。这些理论在机器学习中广泛应用，如相似度计算、注意力机制和核方法等。全文通过投影与对偶性，构建了几何操作与代数表达的统一框架。

2025-08-18 22:01:43 1236

原创线性代数系列知识

本文系统介绍了线性代数的核心内容，包括向量与矩阵基础、线性方程组求解、特征值与特征向量理论。重点阐述了向量运算、矩阵运算规则、秩的理论等基础知识，详细讲解了高斯消元法、解的存在性判定、解空间结构等线性方程组求解方法，并深入探讨了特征值与特征向量的定义、性质、计算及其应用。文章通过几何解释、算法步骤和典型示例，将抽象理论与实际应用相结合，为读者提供了全面的线性代数知识框架。

2025-08-17 00:14:00 2030

原创 Mixture-of-Recursions（MoR）：Transformer的升级

MoR的核心目标是解决传统Transformer的计算冗余和参数低效问题

2025-08-16 22:23:49 684

原创批量梯度下降（BGD）、随机梯度下降（SGD）和小批量梯度下降（MBGD）的性能差异

本文通过三个案例对比了批量梯度下降（BGD）、随机梯度下降（SGD）和小批量梯度下降（MBGD）的性能差异。在小型数据集中，MBGD在速度和稳定性上表现最优；中型数据集中，MBGD避免了BGD的内存溢出问题且训练效率比SGD快3.5倍；大型分布式训练中，MBGD通过批量分割和梯度聚合实现了17倍加速。分析表明，BGD适合小数据精确求解，SGD适用于在线学习，而MBGD在大数据场景下能平衡计算效率和收敛稳定性。建议根据数据规模选择算法，并通过调整批量大小和学习率优化性能。三种算法的本质是梯度估计方差与计算效率

2025-08-16 14:50:04 620

芋道-工作流表-ruoyi-vue-pro-bmp

mysql常用命令

4+1视图模型

uml工具比较文档一览表

vsftpd手册

ajax框架源码

SYBASE PowerDesigner 12 使用指南

JavaScript植物大战僵尸

Ehcache用户手册

精通spring2源码

Spring-Reference_zh_CN.chm

spring-security-2.0.x

邱郁惠-UML和OOAD快速入门-随书ppt

使用 Ajax 实现本地化后的客户端消息验证

ebay的j2ee构架

虚拟光驱daemo

空空如也