自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(66)
  • 收藏
  • 关注

原创 Stable Diffusion实战:AI生成图像的完整流程

使用ADetailer等扩展工具修复面部细节,或通过Img2Img功能局部重绘。注:商业用途需遵守模型许可证(如CreativeML OpenRAIL-M),部分衍生模型可能有额外限制。安装Python 3.10或更高版本,并配置虚拟环境。从Hugging Face下载Stable Diffusion模型(如。),保存至本地目录。对于低显存设备(<8GB),使用。参数或启用模型分片加载。

2025-11-24 23:48:10 144

原创 用PyTorch训练一个猫狗分类器

model.fc = nn.Linear(model.fc.in_features, 2) # 替换全连接层。

2025-11-24 23:47:28 296

原创 【Java】抽象类与抽象方法(abstract)

Java 抽象类与抽象方法(abstract)

2025-11-23 23:00:08 900

原创 用VSCode打造AI开发环境

2025-11-19 23:47:21 443

原创 【Java】理解 main 方法语法与命令行参数

Java 程序启动时,JVM 会在类外部调用类名.main()如果 main 不是public,会出现权限不足的问题,JVM 无法访问此方法。JVM在没有创建对象的情况下执行 main 方法。但程序刚开始运行时,JVM 还不知道如何创建你的类对象,因此必须使用 static。

2025-11-19 23:46:41 792

原创 如何从零实现一个简化版GPT模型

选择适当规模的文本数据集(如WikiText-2)。需实现Tokenizer将文本转换为词元ID序列,建议使用Byte Pair Encoding(BPE)算法,或直接调用HuggingFace的现成Tokenizer。实际部署时建议从现成库(如HuggingFace Transformers)开始,但上述实现有助于理解底层机制。完整实现需约200-300行Python代码,可在单张消费级GPU上训练小型模型。简化版需保留以下关键组件:自注意力层、层归一化、残差连接及位置编码。

2025-11-18 23:29:58 796

原创 Dropout的原理与作用:为什么它能防止过拟合?

具体操作是:在前向传播时,以概率 ( p )(称为丢弃率)临时关闭某些神经元,使其输出置零;未被关闭的神经元输出需缩放为 ( \frac{1}{1-p} ) 以保持期望值不变。每次训练迭代中,关闭的神经元随机选择,形成不同的子网络。设某层神经元输出为 ( y ),Dropout后的输出 ( y' ) 为: [ y' = y \cdot m \cdot \frac{1}{1-p} ] 其中 ( m ) 是服从伯努利分布的掩码矩阵,( m_i \sim \text{Bernoulli}(1-p) )。

2025-11-18 23:28:57 798 1

原创 【Java】关键字 native

是 Java 的一个修饰符,用于标记“本地方法(Native Method)”。本地方法是在 Java 程序中声明,但实际实现在 非 Java 语言(通常是 C/C++) 中的方法。✔ 使用高性能的 C/C++ 库(如 GPU 计算、音视频编解码)✔ 调用操作系统底层 API(如系统级文件锁、权限、驱动)这样的函数没有方法体,因为它的实现由底层代码提供。✔ 实现性能优化的关键流程(内存操作、压缩算法等)✔ 访问特定硬件(摄像头、串口、蓝牙等)就是使用 JNI 的入口。因此 Java 提供了。

2025-11-17 23:59:53 328

原创 Batch Normalization原理+代码实现

公式为: [ \hat{x}^{(k)} = \frac{x^{(k)} - \mu^{(k)}}{\sqrt{(\sigma^{(k)})^2 + \epsilon}} ] 其中,( \mu^{(k)} ) 和 ( \sigma^{(k)} ) 为当前batch中第( k )个特征的均值和标准差,( \epsilon )为极小值防止除零。Batch Normalization(BN)的核心思想是通过对神经网络每一层的输入进行标准化处理(减均值、除标准差),解决深层网络训练时的。

2025-11-17 23:52:30 386

原创 深度学习中的激活函数全解析:该选哪一个?

激活函数为神经网络引入非线性,使模型能够拟合复杂数据模式。没有激活函数,神经网络仅能表达线性变换,无法处理图像、自然语言等高维非线性数据。实际选择需结合任务架构实验验证,通常ReLU家族作为基线,Swish/GELU在调优阶段尝试。

2025-11-15 23:37:15 594

原创 Transformer结构完全解读:从Attention到LLM

多头注意力将输入分成多组,每组独立计算注意力后拼接结果,增强模型捕捉不同子空间信息的能力: [ \text{MultiHead}(Q, K, V) = \text{Concat}(\text{head}_1, ..., \text{head}_h)W^O ] 每个注意力头的计算为: [ \text{head}_i = \text{Attention}(QW_i^Q, KW_i^K, VW_i^V) ] 参数矩阵 (W_i^Q, W_i^K, W_i^V) 和输出投影矩阵 (W^O) 为可学习参数。

2025-11-15 23:32:13 840

原创 RNN与LSTM详解:AI是如何“记住”信息的?

RNN是一种处理序列数据的神经网络,其核心在于通过隐藏状态(hidden state)传递历史信息。每个时间步的输入不仅包括当前数据,还包含上一时间步的隐藏状态,形成循环连接。其中,$h_t$是当前隐藏状态,$x_t$是输入,$W$为权重矩阵,$b$为偏置,$\sigma$为激活函数(如tanh)。LSTM通过引入门控机制(输入门、遗忘门、输出门)和细胞状态(cell state)解决RNN的缺陷。:长序列任务(如机器翻译、语音识别),需捕获长期依赖关系。:短序列任务(如字符级文本生成),计算资源有限时。

2025-11-14 23:31:23 619

原创 CNN详解:卷积神经网络是如何识别图像的?

卷积神经网络(CNN)通过分层结构自动提取图像特征。典型结构包括输入层、卷积层、池化层、全连接层和输出层。CNN通过这种分层特征学习和端到端训练,实现了高效的图像识别能力。

2025-11-14 23:25:17 616

原创 新手必看!Python实现一个简单的神经网络

安装必要的库 确保已安装Python及常用科学计算库。神经网络基础结构 神经网络通常包含输入层、隐藏层和输出层。建议使用成熟的深度学习框架如PyTorch或TensorFlow进行实际项目开发。权重初始化应采用合理方法,如Xavier初始化,避免全零初始化导致对称性问题。批量训练比单样本训练更稳定,建议实现mini-batch功能。学习率调整对训练效果至关重要,可考虑实现自适应学习率算法。隐藏层节点数需要根据任务复杂度调整,过多会导致过拟合。正则化技术如Dropout可防止过拟合。

2025-11-13 23:44:37 302

原创 一次性搞懂反向传播(Backpropagation)原理

\delta$是上游传来的梯度$\partial L/\partial z$,$x$是该层的输入向量。偏置项$b$的梯度直接等于$\delta$。反向传播是训练神经网络的核心算法,通过计算损失函数对网络参数的梯度,利用梯度下降优化网络权重。关键在于高效计算梯度,避免重复计算。$\Delta Z$是上游梯度矩阵。其中$L$是损失函数,$z$是当前层的输出。$\eta$是学习率。更复杂的优化器(如Adam)会引入动量、自适应学习率等机制。这些梯度会与上游梯度相乘后继续反向传播。

2025-11-13 23:38:55 618

原创 机器学习 vs 深度学习:到底有什么区别?

其方法包括监督学习、无监督学习和强化学习,通常依赖人工提取的特征和传统算法(如决策树、SVM、随机森林)。机器学习依赖领域专家手动设计特征(如文本处理中的TF-IDF),深度学习通过隐藏层自动学习层次化特征(如CNN底层识别边缘,高层识别物体部件)。机器学习项目可能数天完成特征工程+模型调优,深度学习项目需数周处理数据增强、超参数搜索(如BERT需16个TPU训练4天)。线性回归、决策树等机器学习模型提供明确规则,深度学习多为黑箱,需依赖可视化工具(如Grad-CAM)间接解释。

2025-11-12 23:08:35 820

原创 手把手教你搭建第一个深度学习模型(附源码)

推荐使用TensorFlow或PyTorch作为深度学习框架。使用经典MNIST手写数字数据集作为入门示例。建议逐步调整网络层数、激活函数等参数观察效果变化。

2025-11-12 23:07:58 435

原创 AI学习路线图2025:从入门到进阶的完整指南

掌握神经网络(CNN、RNN、Transformer)和优化算法(Adam、SGD)。学习监督学习(线性回归、决策树、SVM)和无监督学习(聚类、降维)。推荐课程如Andrew Ng的《机器学习》。实践工具包括Scikit-learn,重点理解模型评估指标(准确率、召回率、ROC曲线)。线性代数、概率统计、微积分是核心数学基础,需掌握矩阵运算、概率分布和梯度下降等概念。关注2025年趋势如多模态学习、AI生成内容(AIGC)、边缘AI部署。计算机视觉需学习目标检测(YOLO)、图像分割(UNet)。

2025-11-11 23:44:09 851

原创 从零开始学AI:小白也能看懂的人工智能入门指南

关注AI研究进展(如arXiv论文),保持对新技术(如生成式AI)的敏感度。AI依赖于数学和编程。人工智能(AI)是通过计算机模拟人类智能的技术,涵盖机器学习、深度学习、自然语言处理等领域。免费资源如Coursera的《机器学习》(Andrew Ng)、Fast.ai的实践课程适合新手。进阶阶段可学习《深度学习》(Ian Goodfellow)或参与行业认证(如Google的TensorFlow证书)。注:学习AI需要耐心,初期可能遇到概念障碍,但通过渐进式实践和社区支持,多数人能逐步掌握核心技能。

2025-11-11 23:42:59 925

原创 一文读懂深度学习:神经网络到底在“学”什么?

反向传播过程中,链式法则计算各层梯度: $$ \frac{\partial L}{\partial w} = \frac{\partial L}{\partial y} \cdot \frac{\partial y}{\partial w} $$均方误差(MSE)和交叉熵(Cross-Entropy)等损失函数量化预测偏差,为参数更新提供方向。浅层网络通常学习基础特征(如边缘、纹理),深层网络则组合这些特征识别高级模式(如物体部件、整体结构)。数据增强通过人工扩展训练样本,提升模型泛化能力。

2025-11-10 23:15:47 428

原创 【Java】面向对象编程

Java面向对象编程

2025-11-10 23:11:22 1702

原创 代码生成与开发辅助

定义代码生成技术的核心概念,阐述其在现代软件开发中的价值。分析开发辅助工具如何提升效率、减少重复劳动以及降低错误率。

2025-11-09 23:00:17 397

原创 如何使用 DeepSeek 帮助自己的工作

2025-11-08 23:29:26 365

原创 嵌入式系统入门指南

定义与特点应用领域(工业控制、智能家居、医疗设备等)与通用计算机系统的区别。

2025-11-06 23:50:35 245

原创 图像分类深度学习

通过对训练图像进行旋转、缩放、翻转等操作,增加数据多样性,防止过拟合。利用预训练模型(如ImageNet上训练的模型)进行微调,适用于数据量较小的场景。常见的预训练模型包括ResNet、EfficientNet、Vision Transformer等。常见的CNN模型有LeNet、AlexNet、VGG、ResNet等。结合多个模型的预测结果,如投票集成或平均集成,提升最终分类性能。对于CNN模型,通常在全连接层使用Dropout。在模型中引入注意力模块(如SE模块、CBAM),让网络关注图像的重要区域。

2025-11-06 23:49:59 652

原创 设备如何“开口说话”

声学模型(如WaveNet、Tacotron)与波形生成。环境传感器(如温度、运动)与语音反馈的关联。实时数据传输协议(如MQTT、CoAP)物联网(IoT)传感器数据采集与处理。文本预处理与自然语言处理(NLP)合规性要求(如GDPR、CCPA)生物特征识别与语音结合的身份验证。工业设备故障预警的语音播报系统。边缘计算与云端分析的协同机制。公共服务场景的无障碍语音辅助。多语言支持与情感化语音定制。低延迟设计的挑战与解决方案。语音数据加密与匿名化处理。AI驱动的自适应语音交互。跨设备语音协同的标准化。

2025-11-04 23:42:33 263

原创 【Java】数组

Java数组

2025-11-04 23:41:34 1790

原创 【Java】流程控制

Java流程控制

2025-11-03 23:00:26 1375

原创 【Java】变量、基本数据类型、运算符

Java变量、基本数据类型、运算符

2025-11-02 19:13:13 1171

原创 AI工具野生测评

提出可量化的技术指标(准确率、响应速度、泛化能力等)和主观体验维度(易用性、创新性、实用性等)。分析野生测评中可能遇到的技术问题(如数据偏差、环境适配性)及应对策略(开源数据集、跨平台测试)。列举常见的AI工具类型(如自然语言处理、图像识别、自动化脚本等),说明野生测评涵盖的技术方向。介绍野生测评大赛的起源、目的和意义,强调民间开发者与专业团队在AI工具测评中的互补性。预测野生测评对AI工具发展的长期价值,如促进厂商优化模型、降低技术使用门槛。提供相关工具文档、开源项目链接及进阶阅读材料。

2025-11-01 10:50:33 219

原创 Linux服务器崩溃急救指南

注:实际操作需根据生产环境差异调整,优先保证数据安全。

2025-11-01 10:49:56 376

原创 Node.js环境变量配置

process.env对象的基本原理与访问方式。环境变量与配置中心(如Consul)的深度集成。环境变量校验库(如envalid)的使用示例。Node.js环境变量的作用与常见应用场景。process.env调试打印的注意事项。VS Code调试时环境变量的注入配置。Docker容器中环境变量的传递方式。dotenv库的安装与基础使用方法。.env文件的标准格式与书写规范。团队协作时的环境变量同步工具推荐。第三方库对环境变量的特殊要求处理。环境变量未生效的常见原因分析。环境变量热更新的实现思路。

2025-10-30 19:24:38 432

原创 MATLAB高效算法实战

MATLAB编程环境与性能优化工具概述。常用数据结构的MATLAB实现。MEX文件的C/C++接口开发。Profiler工具的使用方法。动态数组增长的代价与解决方案。parfor循环的使用与限制。GPU数组操作与CUDA加速。线性代数运算的BLAS层优化。数值积分与微分方程的求解技巧。向量化操作与矩阵运算的优势。FFT算法的应用与参数选择。稀疏矩阵的应用场景与优化。大规模数据处理的优化策略。算法瓶颈定位的实用技巧。图像处理算法的优化实例。机器学习模型的加速方案。预分配内存的最佳实践。

2025-10-30 19:22:16 561

原创 PyTorch实战——从零搭建CV模型

总结PyTorch在CV任务中的核心优势,鼓励读者尝试更多模型变体或开源项目。

2025-10-29 22:29:48 835

原创 VSCode插件开发实战

VSCode插件开发的意义和应用场景开发环境准备(Node.js、VSCode、Yeoman等工具)插件的基本结构和工作原理。

2025-10-29 22:22:58 464

原创 【Kotlin】数组集合常用扩展函数

介绍Kotlin常用扩展函数

2025-10-26 11:54:15 1150

原创 开学季技术指南:高效知识梳理与实战经验分享

Chrome插件推荐:网页高亮与知识归档(如Raindrop.io)。VS Code+插件搭建学习型编辑器(如Markdown笔记增强)。Python脚本示例:自动整理课件/文献(附GitHub代码片段)。多任务并行时的精力分配数据参考(基于RescueTime统计)。优质技术社区索引(Stack Overflow、掘金等)。错误日志的记录与分析(以debug思维类比学习盲点)。开源项目参与入门指南(提交PR的标准化流程)。学科知识模块化拆分技巧(以编程、数学为例)。周报/月报模板(含KPI量化指标)。

2025-10-25 23:40:06 304

原创 IT疑难杂症诊疗室

强调文档化与经验传承的重要性推荐持续学习路径(如CNCF故障排除课程)

2025-10-25 23:38:03 407

原创 AI 算力加速指南:让设计、办公、创作效率翻倍

强调AI算力加速的普惠性,鼓励读者从小规模试点开始探索。

2025-10-22 09:41:18 588

原创 高功耗显卡兼容性难题破解

(注:大纲可根据实际技术细节需求扩展子标题,每个章节建议配备实测数据或工程日志作为支撑材料)

2025-10-22 00:11:32 358

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除