- 博客(1751)
- 资源 (17)
- 收藏
- 关注
原创 AI 深度学习神经网络在线演示网站
摘要:本文汇总了多个深度学习神经网络交互式演示网站,帮助初学者直观理解AI概念。包括TensorFlow Playground(基础神经网络)、CNN Explainer(卷积网络可视化)、GAN Lab(生成对抗网络)等工具,涵盖从入门到专业的不同需求。建议初学者从TensorFlow Playground开始,视觉方向学习者使用CNN Explainer,研究者可选用Netron分析模型结构。这些工具通过可视化交互降低学习门槛,使抽象的深度学习原理变得生动易懂。(149字)
2025-11-08 22:26:48
773
原创 AI: 激活函数ReLU
ReLU激活函数是深度学习的核心组件,其定义为f(x)=max(0,x),具有计算高效(比Sigmoid快6倍)和缓解梯度消失的优势。主要变体包括Leaky ReLU和PReLU,用于解决神经元死亡问题。实际应用中建议配合He初始化,保持30-50%的激活率。ReLU是CNN、Transformer等模型的默认选择,但不适用于输出层。典型问题如神经元死亡可通过Adam优化器、BN层或改用ELU/Swish来改善。
2025-11-08 22:24:24
657
原创 AI神经网络的“灵魂” 常见激活函数 ReLU Sigmoid Tanh
摘要:本文深入介绍了三种常见激活函数(ReLU、Sigmoid、Tanh)的特性与应用。ReLU计算简单、缓解梯度消失,是CNN等现代网络隐藏层的首选;Sigmoid输出(0,1)适合概率输出,但存在梯度消失问题;Tanh零中心化(-1,1),在RNN中表现较好。文章通过函数公式、导数范围、优缺点对比及可视化代码,阐明了不同场景下的选择策略:隐藏层优先ReLU(或变体),输出层根据任务选择Sigmoid(分类)或线性(回归)。最后简要提及Leaky ReLU等改进方案。(149字)
2025-11-08 21:58:32
483
原创 AI:不同缩放方法对具体模型(如SVM、神经网络)性能影响的对比
数据缩放对SVM和神经网络等机器学习模型性能影响显著。标准化(StandardScaler)对异常值稳健,适合正态分布数据;归一化(MinMaxScaler)在数据范围明确时表现更优但对异常值敏感;RobustScaler抗异常值能力强;Normalizer适用于文本等方向敏感任务。实验表明最佳缩放方法因模型和数据集而异,需通过对比测试选择。关键要避免数据泄露,必须用训练集参数同时转换训练和测试集。标准化通常是稳妥起点,归一化在特定场景更有效,实际需根据数据特性和模型需求选择。
2025-11-07 23:27:06
319
原创 AI训练中的归一化 (Normalization)和标准化 (Standardization)及实现方式
在AI训练中,归一化和标准化是两种关键的数据预处理方法。归一化(如Min-Max Scaler)将数据缩放到指定区间(如[0,1]),适用于输出范围有要求的场景,但对异常值敏感;标准化(如Z-score)使数据均值为0、标准差为1,适用于含异常值或基于距离的算法。Scikit-learn提供MinMaxScaler和StandardScaler等工具实现这两种方法。选择依据包括:1)模型类型(梯度下降类模型需缩放);2)数据特性(异常值多选标准化);3)需注意仅基于训练集拟合参数。标准化因鲁棒性较强通常为首
2025-11-07 23:18:14
566
原创 AI训练中的归一化 (Normalization) 和 标准化 (Standardization)
数据预处理中,归一化通过线性变换将数据映射到指定区间(如[0,1]),适用于消除量纲差异和加速梯度下降收敛,但对异常值敏感。标准化则通过Z-score变换调整数据均值为0、标准差为1,能表征数据相对位置,适用于假设数据呈正态分布的算法,对异常值更鲁棒。选择方法需考虑数据特性与模型需求:归一化适合数据分布稳定且无极端值的情况,标准化则更通用,尤其适合存在异常值或基于距离的模型。两种技术都能提升机器学习模型的训练效果和性能。
2025-11-07 23:13:32
404
原创 DeepSeek-OCR全面应用指南
摘要 DeepSeek-OCR是DeepSeek AI推出的创新多模态模型,采用"上下文光学压缩"技术实现高效文本处理,在10倍压缩比下精度达97%。该系统支持五种分辨率模式,日处理20万页数据,可识别文档、表格、公式等复杂内容。安装需24GB以上显存GPU和Python 3.12.9环境,提供本地部署和云端服务两种方案。应用场景包括企业文档数字化、学术研究、金融法律等领域,通过提示词工程和批量处理可优化性能。推荐初学者从云端服务体验,企业用户采用Linux服务器部署以获得完整功能。随着
2025-11-03 23:31:58
1355
原创 DeepSeek-OCR:视觉压缩长文本的理论突破与架构解析
摘要: DeepSeek-OCR是DeepSeek AI发布的革命性视觉-文本压缩模型,通过将文本视为连续视觉信号进行高效压缩,突破传统Transformer二次方复杂度限制。其核心架构包括DeepEncoder视觉编码器(3.8亿参数)和MoE解码器(30亿参数,稀疏激活),支持多分辨率动态处理,实现最高20:1的压缩比。训练采用两阶段策略,结合3000万页多语言数据,在文档数字化、知识管理等领域展现显著优势。该技术验证了"视觉作为文本压缩器"的可行性,为LLM长上下文处理提供新范式,
2025-11-03 23:29:18
1107
原创 DeepSeek-OCR 视觉-文本压缩 创新多模态模型
摘要:DeepSeek-OCR是DeepSeek AI团队推出的创新多模态OCR模型,采用"视觉-文本压缩"技术实现高效文档处理。其双模块架构包含3.8亿参数的视觉编码器和3B-MoE解码器,支持5种分辨率模式,在10倍压缩率下仍保持97%准确率。该模型突破性地解决了传统OCR的结构保持、多语言支持和复杂内容解析等痛点,支持PDF/图像批量处理并输出结构化Markdown。典型应用场景包括企业文档数字化、学术研究及LLM训练等。该模型已完全开源,提供完整工具链和技术文档,为长文本处理提供
2025-11-03 23:24:00
958
原创 AI:梯度下降法实现线性回归步骤
梯度下降算法是机器学习中优化模型参数的核心方法,通过迭代调整参数使预测值逼近真实值。其核心思想是沿损失函数梯度反方向更新参数,逐步降低误差。算法实现包括初始化参数、计算梯度、更新参数和迭代优化四个步骤。学习率的选择至关重要,过大会导致震荡,过小则收敛缓慢。梯度下降有三种变体:批量、随机和小批量,各有优缺点。该算法通用性强、效率高,但可能陷入局部最优或鞍点。通过多初始值、自适应学习率和特征缩放等策略可提升性能。梯度下降为线性回归和更复杂模型提供了基础优化框架。
2025-10-23 00:42:32
909
原创 AI机器学习:梯度下降算法实现线性回归的详细解析
本文详细解析了梯度下降算法实现线性回归的原理与过程。首先介绍了线性回归的基本概念和损失函数,然后深入讲解了梯度下降的数学原理和参数更新规则。通过房屋价格预测的具体示例,展示了梯度下降的计算步骤和可视化效果,包括损失函数曲面、参数更新路径和损失值变化曲线。最后提供了Python实现代码,涵盖数据准备、参数初始化、梯度下降迭代和结果可视化等完整流程。文章通过理论推导与代码实践相结合的方式,帮助读者全面理解梯度下降算法在解决线性回归问题中的应用。
2025-10-23 00:40:33
926
原创 SQL Oracle 中,将 纵表(行结构存储属性值)转换为 横表
Oracle纵表转横表主要有两种方法:1.使用PIVOT子句(Oracle 11g以上),通过指定属性列和聚合函数(如MAX)实现转换;2.使用条件聚合(兼容所有版本),通过CASE WHEN语句实现。关键注意事项包括:合理选择聚合函数、处理空值(NVL)、动态列名需用动态SQL。对于属性值不固定的情况,需要构建动态SQL语句。两种方法都需要预先知道要转换的属性值,静态属性可直接转换,动态属性则需额外处理。
2025-10-10 20:04:21
489
原创 Android布局 占位view layout_weight layout_height
摘要:文章分析了Android布局中layout_weight属性的核心机制,指出其行为取决于layout_width/height的设置。当设为wrap_content时,系统会先分配内容空间再分配剩余空间,可能导致布局异常。解决方案是将占位View的layout_height改为0dp或使用Space视图替代。最佳实践包括:权重与尺寸搭配使用0dp、避免过度嵌套、明确设置weightSum。掌握这些规律能有效实现自适应布局。
2025-10-10 01:02:16
337
原创 Android布局 将按钮左右分开的方案
摘要:针对界面按钮布局需求,提供了三种实现方案对比。方案一(推荐)使用权重+占位视图实现左右分区,简单可靠;方案二采用嵌套LinearLayout使结构更清晰;方案三利用ConstraintLayout实现精准对齐。表格对比了各方案特点,并附具体实现代码,适用于不同开发场景下的灵活布局需求。
2025-10-10 00:59:28
347
原创 Android 分批发送蓝牙数据 MTU请求和服务发现的顺序问题
摘要:优化蓝牙数据传输的关键在于调整操作顺序和增强错误处理。建议在发现服务成功后再请求MTU,并严格检查特征属性是否支持所需操作。关键改进包括:1)将MTU请求移至服务发现后;2)添加特征属性验证;3)完善状态管理;4)在关键操作间加入短暂延迟。这些调整能提升连接稳定性,确保数据可靠传输。代码示例展示了如何实现特征属性检查和状态更新,流程图则清晰呈现优化后的BLE打印数据流。
2025-10-10 00:46:50
1128
原创 Android 典型的 BLE 数据传输限制问题 蓝牙发送时被截断
蓝牙BLE传输中JSON数据被截断的解决方案:BLE协议默认单次传输限制为20字节有效数据。解决方案包括:1) 协商更大的MTU(最大247字节);2) 实现数据分段发送,按MTU大小切分数据;3) 检查特征值属性,选择合适的写入类型;4) 添加传输状态监控。实践建议从测试小数据开始,逐步增加长度,并加入数据校验机制。通过优化传输协议和分段处理,可有效解决BLE数据传输限制问题。
2025-10-10 00:40:27
955
原创 GIT: git checkout 将文件从 A 分支合并到 B 分支的方法
git中将x文件的所有更新 从A分支合并B分支,只包含这个文件的更新,其它提交不合并过去。
2025-09-22 19:47:49
975
原创 Android:蓝牙设备的标识方式
蓝牙设备可通过多种方式标识:MAC地址(最可靠且唯一)、设备名称(可修改不唯一)、UUID(标识服务)、配对状态和设备类(BLE设备还有额外标识方式)。最佳实践是优先使用MAC地址,辅以设备名称和设备类作为备用识别方式。应用开发中应提供设备选择界面,保存用户选择的打印机的MAC地址和名称,确保可靠连接。
2025-09-21 00:13:50
803
原创 Android应用国际化实现方案
Android支票应用国际化实现方案:通过创建values/strings.xml(英文)和values-zh/strings.xml(中文)资源文件,实现UI文本的多语言支持。方案包含按钮文本、字段提示、标签文本、对话框内容等完整翻译,并配合LanguageManager工具类实现语言切换功能,支持中英文双语切换。货币单位等本地化内容也做了相应适配,确保应用在不同语言环境下都能正常使用。
2025-09-19 01:00:05
334
原创 Android:AndroidManifest.xml 配置对横屏显示的影响分析
AndroidManifest.xml中的configChanges属性配置会影响横屏布局处理方式。当设置了orientation|screenSize|keyboardHidden时,屏幕旋转不会重建Activity,系统也不会自动加载横屏布局(layout-land/),需要开发者手动处理。解决方案包括:1)移除configChanges让系统自动处理;2)保留配置并在Activity中手动切换布局;3)使用Fragment管理不同方向的布局。建议根据项目复杂度选择合适方案,并确保正确创建layout/
2025-09-19 00:56:14
753
原创 Android:支票应用更换底图功能
支票底图自定义功能实现 摘要:支票应用新增照片选择和图片库功能,允许用户自定义支票底图。实现方案包括: 添加相机和存储权限配置 创建文件提供者和路径配置 在布局中添加底图更换按钮 实现图片选择逻辑:支持拍照、相册选择和恢复默认底图 处理相机和存储权限请求 提供选择对话框让用户选择图片来源 代码已实现权限检查、图片获取和默认背景恢复功能,为用户提供灵活的背景更换体验。
2025-09-16 00:32:59
591
原创 Android 支票打印功能实现
本文介绍了一个Android支票打印应用的实现方案,包含支票底图加载、字段位置设置、数据填写和蓝牙打印功能。应用采用以下设计: 主界面显示支票底图,允许用户拖动调整字段位置(收款人、日期、金额及英文描述) 点击字段可编辑内容,长按可拖动调整位置 通过蓝牙将字段位置和内容打包为JSON发送至打印设备 技术实现包括: 使用FrameLayout叠加底图和可拖动TextView 为字段添加红色边框标识 实现触摸事件处理拖动逻辑 将布局数据转换为JSON格式 通过蓝牙Socket传输打印数据 该方案提供了完整的用户
2025-09-14 21:25:19
1196
原创 git:本地项目上传到 Gitee怎么做?
本文介绍了两种将本地项目上传到Gitee的方法:克隆后推送(推荐)和本地初始化后推送。表格对比了两种方法的适用场景、步骤和注意事项。详细步骤包括:注册账号、安装Git、配置SSH公钥、创建空仓库、克隆/初始化仓库、提交推送等操作。同时提供了常见问题解决方案,如权限不足、历史冲突等。建议使用.gitignore文件过滤不需要上传的文件,并注意仓库大小限制。两种方法均可实现项目上传,新手推荐使用克隆后推送以避免冲突。
2025-09-14 21:19:37
554
原创 芯片:最强的手机芯片对比
当前手机芯片竞争激烈,天玑9400+、骁龙8 Elite和苹果A18 Pro是三大旗舰芯片。天玑9400+采用3nm工艺,安兔兔跑分超305万;骁龙8 Elite配备自研Oryon架构,AI算力45TOPS;A18 Pro单核性能突出,AI算力达200TOPS。AI能力成为新焦点,骁龙8 Gen5预计2025年底上市,跑分近300万。实际体验还需结合系统优化和散热设计。选购建议:追求性能选天玑9400+或骁龙8 Elite,注重生态选A18 Pro,性价比可关注骁龙8 Gen5或上代旗舰芯片。
2025-08-31 21:45:15
7741
原创 华为麒麟9010、9020、9030、9040系列芯片的性能参数及其与高通芯片的对比
摘要: 华为麒麟9010、9020、9030、9040系列芯片在工艺制程、CPU/GPU配置、AI算力等方面持续优化,性能逐步接近高通旗舰芯片。麒麟9020多核性能超骁龙8+ Gen1,9030预计对标骁龙8 Gen3,9040目标定位骁龙8 Elite。华为通过架构优化、国产等效5nm工艺及鸿蒙系统深度协同,在能效、通信(5.5G基带)和AI(40TOPS NPU)方面具备优势。实际体验因软硬件结合(如GPU Turbo)往往优于跑分,未来迭代值得关注。(150字)
2025-08-31 21:42:21
16087
原创 Flowable的内部机制 HistoricVariableInstance::getVariableName NullPointerException问题
摘要:当HistoricVariableInstance::getVariableName理论上不应返回null却引发NullPointerException时,可能源于Flowable变量存储机制异常、Collectors.toMap对null值的限制,或流程实例状态问题。解决方案包括添加null检查、处理null值及验证流程实例ID。最佳实践建议采用防御性编程、使用Optional、日志记录和输入验证来预防此类问题。核心措施是在数据转换前进行null过滤,确保Map键值有效,避免NPE异常。
2025-08-31 21:34:35
491
原创 Flowable获取历史表单数据方法
Flowable工作流引擎中,历史表单数据以流程变量形式存储在历史表中,可通过HistoryService接口查询。主要有三种方法:1)使用HistoricVariableInstanceQuery获取所有流程变量;2)通过HistoricDetailQuery查询详细表单提交记录;3)结合历史任务查询特定节点的表单数据。外置表单和文件数据同样适用这些方法,但需注意性能优化和数据类型转换。实际开发中建议根据审计需求选择查询方式,并处理大数据量分页问题。
2025-08-31 21:28:55
840
原创 OCR大模型 dots.ocr PK 主流OCR模型
摘要: dots.ocr是一款创新的端到端OCR大模型,采用统一视觉语言架构(1.7B参数/6GB),支持100+语言和复杂文档解析(表格、公式等)。相比主流OCR,其优势在于:多语言错误率低50%、表格解析TEDS 88.6(超越Surya)、动态任务切换(通过Prompt调整)。部署需20GB显存(RTX 4090/A100),适合学术文献、多语言场景,但存在超高分辨率需降采样、特殊字符敏感等限制。技术选型上,dots.ocr在综合性能领先,而PaddleOCR(轻量化)、EasyOCR(快速集成)、S
2025-08-18 22:22:09
1669
原创 主流开源OCR模型对比
开源OCR大模型选型指南 主流OCR工具各具特色:Tesseract支持100+语言,适合多语言印刷体;PaddleOCR中文识别最强,专精证件/表格处理;EasyOCR多语言快速部署;GOT-OCR 2.0支持公式/图表多模态解析;Surya擅长复杂表格识别;olmOCR专注PDF结构化解析;Umi-OCR满足离线轻量需求。选型需结合场景:中文优先PaddleOCR,学术文献选GOT-OCR/olmOCR,移动端用Umi-OCR,多语言考虑EasyOCR/Tesseract。未来趋势聚焦多模态融合与端到端
2025-08-18 22:19:46
3447
原创 开源OCR大模型dots.ocr的全面解析
摘要: dots.ocr是小红书Hi Lab团队开源的多语言OCR模型(1.7B参数),采用视觉语言模型架构实现端到端文档解析,支持100+语言、表格/公式提取和结构化输出。性能上,其表格解析(TEDS 88.6%)和低资源语言处理优于Gemini、PaddleOCR等主流模型,但需20GB显存。适用于学术文献、金融报表等复杂场景,虽在超高分辨率图像和特殊字符处理存在局限,但以轻量化参数实现高效多任务整合,推动OCR技术向高效架构发展。开源地址可获取模型及在线体验。 (注:摘要严格控制在150字内,涵盖核心
2025-08-18 22:17:08
3464
原创 点积、线性变换、矩阵乘法与几何空间通过投影与对偶性紧密相连
本文从几何角度解析了点积、线性变换与矩阵乘法的本质关联。点积的物理意义体现为投影操作与尺度变换的复合,其符号反映向量方向关系。点积运算等价于高维空间到一维的线性变换,这种对偶性揭示了一维变换均可表示为与某固定向量的点积。矩阵乘法本质是线性变换的复合,而行列式则量化了变换对空间的体积缩放与定向改变。这些理论在机器学习中广泛应用,如相似度计算、注意力机制和核方法等。全文通过投影与对偶性,构建了几何操作与代数表达的统一框架。
2025-08-18 22:01:43
1141
原创 线性代数系列知识
本文系统介绍了线性代数的核心内容,包括向量与矩阵基础、线性方程组求解、特征值与特征向量理论。重点阐述了向量运算、矩阵运算规则、秩的理论等基础知识,详细讲解了高斯消元法、解的存在性判定、解空间结构等线性方程组求解方法,并深入探讨了特征值与特征向量的定义、性质、计算及其应用。文章通过几何解释、算法步骤和典型示例,将抽象理论与实际应用相结合,为读者提供了全面的线性代数知识框架。
2025-08-17 00:14:00
1875
原创 Mixture-of-Recursions(MoR):Transformer的升级
MoR的核心目标是解决传统Transformer的计算冗余和参数低效问题
2025-08-16 22:23:49
655
原创 批量梯度下降(BGD)、随机梯度下降(SGD)和小批量梯度下降(MBGD)的性能差异
本文通过三个案例对比了批量梯度下降(BGD)、随机梯度下降(SGD)和小批量梯度下降(MBGD)的性能差异。在小型数据集中,MBGD在速度和稳定性上表现最优;中型数据集中,MBGD避免了BGD的内存溢出问题且训练效率比SGD快3.5倍;大型分布式训练中,MBGD通过批量分割和梯度聚合实现了17倍加速。分析表明,BGD适合小数据精确求解,SGD适用于在线学习,而MBGD在大数据场景下能平衡计算效率和收敛稳定性。建议根据数据规模选择算法,并通过调整批量大小和学习率优化性能。三种算法的本质是梯度估计方差与计算效率
2025-08-16 14:50:04
578
原创 Jackson 无法序列化 Hutool 的 `JSONNull` 对象
摘要: Hutool的JSONNull对象导致Jackson序列化失败(InvalidDefinitionException),可通过三种方案解决: 1️⃣ 推荐方案:在数据返回前将Hutool的JSONObject/JSONArray递归转为标准Java对象(Map/List),彻底消除JSONNull; 2️⃣ 兼容方案:为JSONNull注册自定义Jackson序列化器,强制输出为JSON的null; 3️⃣ 临时方案:禁用FAIL_ON_EMPTY_BEANS(不推荐,可能隐藏其他错误)。建议优先采
2025-08-15 23:22:15
526
原创 在深度神经网络中,梯度下降会遇到梯度消失/爆炸问题,有哪些解决方案?
在深度神经网络训练中,梯度消失(梯度趋近于零)和梯度爆炸(梯度指数级增长)是阻碍模型收敛的核心问题。解决思路有三:
2025-08-15 23:17:49
878
原创 梯度下降算法 自适应学习率策略(如Adam)
自适应学习率策略(如Adam)通过动态调整每个参数的学习率,解决了传统梯度下降中固定学习率的局限性(如收敛速度慢、易震荡)。其核心在于利用历史梯度信息为不同参数生成定制化的学习率。
2025-08-15 23:03:19
1168
原创 梯度下降算法:原理与高效实现
本文系统阐述了梯度下降算法的数学原理与实现技术。通过参数更新规则θ=θ-α∇J(θ),算法沿梯度反方向逐步优化目标函数。重点介绍了三种实现方式:基础Python实现、线性回归应用和小批量梯度下降,并分析了批量大小对效率和稳定性的影响。文章还探讨了并行计算加速方法,对比了不同梯度下降变体的适用场景,提供了自适应学习率、动量法等调优技巧。最后强调精确梯度计算、合理学习率设定和特征标准化的重要性,推荐使用小批量梯度下降配合Adam优化器实现高效优化。
2025-08-15 22:56:07
1244
原创 Spring Cloud 中,@FeignClient注解的 url属性通过占位符注入详解
摘要: Spring Cloud中@FeignClient的url属性支持通过占位符(如${feign.url.property})动态注入配置值,其核心机制依赖Spring环境属性解析与Feign代理初始化。启动时,Spring从配置源解析占位符并硬编码到Feign代理,后续请求直接使用该URL(绕过服务发现)。动态刷新需配合@RefreshScope重建代理。注意事项:1) 配置优先级遵循Spring规则;2) URL需显式声明协议;3) 生产环境慎用(丧失负载均衡能力);4) 建议多环境隔离配置。最佳
2025-08-13 23:49:58
1039
原创 Spring Cloud微服务架构中,使用FeignClient结合Nacos,无需重启服务的动态修改FeignClient URL的方案
摘要:在Spring Cloud微服务中,动态修改FeignClient URL的5种方案:1) 配置中心动态刷新(Nacos+@RefreshScope);2) 运行时编程修改(自定义Feign.Builder);3) AOP切面路由(拦截请求替换URL);4) 环境隔离(Profile分环境配置);5) 开发工具热加载(DevTools/JRebel)。推荐开发调试用方案2或5,生产环境优先方案1或3。所有方案均绕过注册中心,需注意负载均衡失效问题,适用于特殊场景调试。(149字)
2025-08-13 23:42:20
760
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅