- 博客(66)
- 收藏
- 关注
原创 Stable Diffusion实战:AI生成图像的完整流程
使用ADetailer等扩展工具修复面部细节,或通过Img2Img功能局部重绘。注:商业用途需遵守模型许可证(如CreativeML OpenRAIL-M),部分衍生模型可能有额外限制。安装Python 3.10或更高版本,并配置虚拟环境。从Hugging Face下载Stable Diffusion模型(如。),保存至本地目录。对于低显存设备(<8GB),使用。参数或启用模型分片加载。
2025-11-24 23:48:10
144
原创 用PyTorch训练一个猫狗分类器
model.fc = nn.Linear(model.fc.in_features, 2) # 替换全连接层。
2025-11-24 23:47:28
296
原创 【Java】理解 main 方法语法与命令行参数
Java 程序启动时,JVM 会在类外部调用类名.main()如果 main 不是public,会出现权限不足的问题,JVM 无法访问此方法。JVM在没有创建对象的情况下执行 main 方法。但程序刚开始运行时,JVM 还不知道如何创建你的类对象,因此必须使用 static。
2025-11-19 23:46:41
792
原创 如何从零实现一个简化版GPT模型
选择适当规模的文本数据集(如WikiText-2)。需实现Tokenizer将文本转换为词元ID序列,建议使用Byte Pair Encoding(BPE)算法,或直接调用HuggingFace的现成Tokenizer。实际部署时建议从现成库(如HuggingFace Transformers)开始,但上述实现有助于理解底层机制。完整实现需约200-300行Python代码,可在单张消费级GPU上训练小型模型。简化版需保留以下关键组件:自注意力层、层归一化、残差连接及位置编码。
2025-11-18 23:29:58
796
原创 Dropout的原理与作用:为什么它能防止过拟合?
具体操作是:在前向传播时,以概率 ( p )(称为丢弃率)临时关闭某些神经元,使其输出置零;未被关闭的神经元输出需缩放为 ( \frac{1}{1-p} ) 以保持期望值不变。每次训练迭代中,关闭的神经元随机选择,形成不同的子网络。设某层神经元输出为 ( y ),Dropout后的输出 ( y' ) 为: [ y' = y \cdot m \cdot \frac{1}{1-p} ] 其中 ( m ) 是服从伯努利分布的掩码矩阵,( m_i \sim \text{Bernoulli}(1-p) )。
2025-11-18 23:28:57
798
1
原创 【Java】关键字 native
是 Java 的一个修饰符,用于标记“本地方法(Native Method)”。本地方法是在 Java 程序中声明,但实际实现在 非 Java 语言(通常是 C/C++) 中的方法。✔ 使用高性能的 C/C++ 库(如 GPU 计算、音视频编解码)✔ 调用操作系统底层 API(如系统级文件锁、权限、驱动)这样的函数没有方法体,因为它的实现由底层代码提供。✔ 实现性能优化的关键流程(内存操作、压缩算法等)✔ 访问特定硬件(摄像头、串口、蓝牙等)就是使用 JNI 的入口。因此 Java 提供了。
2025-11-17 23:59:53
328
原创 Batch Normalization原理+代码实现
公式为: [ \hat{x}^{(k)} = \frac{x^{(k)} - \mu^{(k)}}{\sqrt{(\sigma^{(k)})^2 + \epsilon}} ] 其中,( \mu^{(k)} ) 和 ( \sigma^{(k)} ) 为当前batch中第( k )个特征的均值和标准差,( \epsilon )为极小值防止除零。Batch Normalization(BN)的核心思想是通过对神经网络每一层的输入进行标准化处理(减均值、除标准差),解决深层网络训练时的。
2025-11-17 23:52:30
386
原创 深度学习中的激活函数全解析:该选哪一个?
激活函数为神经网络引入非线性,使模型能够拟合复杂数据模式。没有激活函数,神经网络仅能表达线性变换,无法处理图像、自然语言等高维非线性数据。实际选择需结合任务架构实验验证,通常ReLU家族作为基线,Swish/GELU在调优阶段尝试。
2025-11-15 23:37:15
594
原创 Transformer结构完全解读:从Attention到LLM
多头注意力将输入分成多组,每组独立计算注意力后拼接结果,增强模型捕捉不同子空间信息的能力: [ \text{MultiHead}(Q, K, V) = \text{Concat}(\text{head}_1, ..., \text{head}_h)W^O ] 每个注意力头的计算为: [ \text{head}_i = \text{Attention}(QW_i^Q, KW_i^K, VW_i^V) ] 参数矩阵 (W_i^Q, W_i^K, W_i^V) 和输出投影矩阵 (W^O) 为可学习参数。
2025-11-15 23:32:13
840
原创 RNN与LSTM详解:AI是如何“记住”信息的?
RNN是一种处理序列数据的神经网络,其核心在于通过隐藏状态(hidden state)传递历史信息。每个时间步的输入不仅包括当前数据,还包含上一时间步的隐藏状态,形成循环连接。其中,$h_t$是当前隐藏状态,$x_t$是输入,$W$为权重矩阵,$b$为偏置,$\sigma$为激活函数(如tanh)。LSTM通过引入门控机制(输入门、遗忘门、输出门)和细胞状态(cell state)解决RNN的缺陷。:长序列任务(如机器翻译、语音识别),需捕获长期依赖关系。:短序列任务(如字符级文本生成),计算资源有限时。
2025-11-14 23:31:23
619
原创 CNN详解:卷积神经网络是如何识别图像的?
卷积神经网络(CNN)通过分层结构自动提取图像特征。典型结构包括输入层、卷积层、池化层、全连接层和输出层。CNN通过这种分层特征学习和端到端训练,实现了高效的图像识别能力。
2025-11-14 23:25:17
616
原创 新手必看!Python实现一个简单的神经网络
安装必要的库 确保已安装Python及常用科学计算库。神经网络基础结构 神经网络通常包含输入层、隐藏层和输出层。建议使用成熟的深度学习框架如PyTorch或TensorFlow进行实际项目开发。权重初始化应采用合理方法,如Xavier初始化,避免全零初始化导致对称性问题。批量训练比单样本训练更稳定,建议实现mini-batch功能。学习率调整对训练效果至关重要,可考虑实现自适应学习率算法。隐藏层节点数需要根据任务复杂度调整,过多会导致过拟合。正则化技术如Dropout可防止过拟合。
2025-11-13 23:44:37
302
原创 一次性搞懂反向传播(Backpropagation)原理
\delta$是上游传来的梯度$\partial L/\partial z$,$x$是该层的输入向量。偏置项$b$的梯度直接等于$\delta$。反向传播是训练神经网络的核心算法,通过计算损失函数对网络参数的梯度,利用梯度下降优化网络权重。关键在于高效计算梯度,避免重复计算。$\Delta Z$是上游梯度矩阵。其中$L$是损失函数,$z$是当前层的输出。$\eta$是学习率。更复杂的优化器(如Adam)会引入动量、自适应学习率等机制。这些梯度会与上游梯度相乘后继续反向传播。
2025-11-13 23:38:55
618
原创 机器学习 vs 深度学习:到底有什么区别?
其方法包括监督学习、无监督学习和强化学习,通常依赖人工提取的特征和传统算法(如决策树、SVM、随机森林)。机器学习依赖领域专家手动设计特征(如文本处理中的TF-IDF),深度学习通过隐藏层自动学习层次化特征(如CNN底层识别边缘,高层识别物体部件)。机器学习项目可能数天完成特征工程+模型调优,深度学习项目需数周处理数据增强、超参数搜索(如BERT需16个TPU训练4天)。线性回归、决策树等机器学习模型提供明确规则,深度学习多为黑箱,需依赖可视化工具(如Grad-CAM)间接解释。
2025-11-12 23:08:35
820
原创 手把手教你搭建第一个深度学习模型(附源码)
推荐使用TensorFlow或PyTorch作为深度学习框架。使用经典MNIST手写数字数据集作为入门示例。建议逐步调整网络层数、激活函数等参数观察效果变化。
2025-11-12 23:07:58
435
原创 AI学习路线图2025:从入门到进阶的完整指南
掌握神经网络(CNN、RNN、Transformer)和优化算法(Adam、SGD)。学习监督学习(线性回归、决策树、SVM)和无监督学习(聚类、降维)。推荐课程如Andrew Ng的《机器学习》。实践工具包括Scikit-learn,重点理解模型评估指标(准确率、召回率、ROC曲线)。线性代数、概率统计、微积分是核心数学基础,需掌握矩阵运算、概率分布和梯度下降等概念。关注2025年趋势如多模态学习、AI生成内容(AIGC)、边缘AI部署。计算机视觉需学习目标检测(YOLO)、图像分割(UNet)。
2025-11-11 23:44:09
851
原创 从零开始学AI:小白也能看懂的人工智能入门指南
关注AI研究进展(如arXiv论文),保持对新技术(如生成式AI)的敏感度。AI依赖于数学和编程。人工智能(AI)是通过计算机模拟人类智能的技术,涵盖机器学习、深度学习、自然语言处理等领域。免费资源如Coursera的《机器学习》(Andrew Ng)、Fast.ai的实践课程适合新手。进阶阶段可学习《深度学习》(Ian Goodfellow)或参与行业认证(如Google的TensorFlow证书)。注:学习AI需要耐心,初期可能遇到概念障碍,但通过渐进式实践和社区支持,多数人能逐步掌握核心技能。
2025-11-11 23:42:59
925
原创 一文读懂深度学习:神经网络到底在“学”什么?
反向传播过程中,链式法则计算各层梯度: $$ \frac{\partial L}{\partial w} = \frac{\partial L}{\partial y} \cdot \frac{\partial y}{\partial w} $$均方误差(MSE)和交叉熵(Cross-Entropy)等损失函数量化预测偏差,为参数更新提供方向。浅层网络通常学习基础特征(如边缘、纹理),深层网络则组合这些特征识别高级模式(如物体部件、整体结构)。数据增强通过人工扩展训练样本,提升模型泛化能力。
2025-11-10 23:15:47
428
原创 图像分类深度学习
通过对训练图像进行旋转、缩放、翻转等操作,增加数据多样性,防止过拟合。利用预训练模型(如ImageNet上训练的模型)进行微调,适用于数据量较小的场景。常见的预训练模型包括ResNet、EfficientNet、Vision Transformer等。常见的CNN模型有LeNet、AlexNet、VGG、ResNet等。结合多个模型的预测结果,如投票集成或平均集成,提升最终分类性能。对于CNN模型,通常在全连接层使用Dropout。在模型中引入注意力模块(如SE模块、CBAM),让网络关注图像的重要区域。
2025-11-06 23:49:59
652
原创 设备如何“开口说话”
声学模型(如WaveNet、Tacotron)与波形生成。环境传感器(如温度、运动)与语音反馈的关联。实时数据传输协议(如MQTT、CoAP)物联网(IoT)传感器数据采集与处理。文本预处理与自然语言处理(NLP)合规性要求(如GDPR、CCPA)生物特征识别与语音结合的身份验证。工业设备故障预警的语音播报系统。边缘计算与云端分析的协同机制。公共服务场景的无障碍语音辅助。多语言支持与情感化语音定制。低延迟设计的挑战与解决方案。语音数据加密与匿名化处理。AI驱动的自适应语音交互。跨设备语音协同的标准化。
2025-11-04 23:42:33
263
原创 AI工具野生测评
提出可量化的技术指标(准确率、响应速度、泛化能力等)和主观体验维度(易用性、创新性、实用性等)。分析野生测评中可能遇到的技术问题(如数据偏差、环境适配性)及应对策略(开源数据集、跨平台测试)。列举常见的AI工具类型(如自然语言处理、图像识别、自动化脚本等),说明野生测评涵盖的技术方向。介绍野生测评大赛的起源、目的和意义,强调民间开发者与专业团队在AI工具测评中的互补性。预测野生测评对AI工具发展的长期价值,如促进厂商优化模型、降低技术使用门槛。提供相关工具文档、开源项目链接及进阶阅读材料。
2025-11-01 10:50:33
219
原创 Node.js环境变量配置
process.env对象的基本原理与访问方式。环境变量与配置中心(如Consul)的深度集成。环境变量校验库(如envalid)的使用示例。Node.js环境变量的作用与常见应用场景。process.env调试打印的注意事项。VS Code调试时环境变量的注入配置。Docker容器中环境变量的传递方式。dotenv库的安装与基础使用方法。.env文件的标准格式与书写规范。团队协作时的环境变量同步工具推荐。第三方库对环境变量的特殊要求处理。环境变量未生效的常见原因分析。环境变量热更新的实现思路。
2025-10-30 19:24:38
432
原创 MATLAB高效算法实战
MATLAB编程环境与性能优化工具概述。常用数据结构的MATLAB实现。MEX文件的C/C++接口开发。Profiler工具的使用方法。动态数组增长的代价与解决方案。parfor循环的使用与限制。GPU数组操作与CUDA加速。线性代数运算的BLAS层优化。数值积分与微分方程的求解技巧。向量化操作与矩阵运算的优势。FFT算法的应用与参数选择。稀疏矩阵的应用场景与优化。大规模数据处理的优化策略。算法瓶颈定位的实用技巧。图像处理算法的优化实例。机器学习模型的加速方案。预分配内存的最佳实践。
2025-10-30 19:22:16
561
原创 VSCode插件开发实战
VSCode插件开发的意义和应用场景开发环境准备(Node.js、VSCode、Yeoman等工具)插件的基本结构和工作原理。
2025-10-29 22:22:58
464
原创 开学季技术指南:高效知识梳理与实战经验分享
Chrome插件推荐:网页高亮与知识归档(如Raindrop.io)。VS Code+插件搭建学习型编辑器(如Markdown笔记增强)。Python脚本示例:自动整理课件/文献(附GitHub代码片段)。多任务并行时的精力分配数据参考(基于RescueTime统计)。优质技术社区索引(Stack Overflow、掘金等)。错误日志的记录与分析(以debug思维类比学习盲点)。开源项目参与入门指南(提交PR的标准化流程)。学科知识模块化拆分技巧(以编程、数学为例)。周报/月报模板(含KPI量化指标)。
2025-10-25 23:40:06
304
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅