深度学习
文章平均质量分 93
easy2020
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
用 LoRA 微调 Qwen3-0.6B 模型,打造专属宠物商店智能客服
以 Qwen3-0.6B 模型为基础,结合自制的宠物商店客服语料,通过 LoRA 轻量化微调技术,训练出一个能够回答常见宠物商店问题的智能客服模型。该实践展示了如何在低成本条件下快速打造垂直领域对话系统,为中小企业智能化应用提供了参考。原创 2025-09-26 16:57:03 · 2217 阅读 · 0 评论 -
从 BERT 到 GPT—— 基于 Transformer 架构的演变与能力分化
以Transformer架构为基础,深入解析了两大基于此架构的预训练模型——BERT与GPT的工作原理及其核心差异,探讨了Transformer架构在多模态处理等领域的技术延伸,展示了其灵活性和广泛的应用潜力。原创 2025-09-23 16:33:14 · 1921 阅读 · 0 评论 -
Transformer 揭秘:自注意力机制如何改变 AI 格局
回顾了深度学习模型从 MLP、CNN、RNN 到 Transformer 的演进逻辑,揭示了 Transformer 为突破 CNN/RNN 在长距离依赖建模与训练效率上的瓶颈而诞生的技术必然性。原创 2025-09-22 10:09:53 · 945 阅读 · 0 评论 -
RNN + 超参数调优打造电影评论情感分析模型
构建了基于循环神经网络(RNN)的 IMDb 电影评论情感分析系统,实现了端到端的情感分类流程,展示了自动化调参、模型诊断与结果分析过程。原创 2025-09-21 17:22:50 · 1142 阅读 · 0 评论 -
MLP和CNN在图片识别中的对比——基于猫狗分类项目的实战分析
基于 cats_and_dogs_filtered 数据集,通过 MLP 与 CNN 的对比实验,系统探讨了影响图像分类模型性能的关键因素。实验表明,初始 CNN 模型因训练不充分与数据增强不足导致性能平庸;经优化数据增强、加深网络、引入正则化与智能训练策略后,验证准确率显著提升。研究证实:CNN 的空间特征提取能力是其优势基础,而合理的调参策略是释放其潜力的关键,体现了“模型结构决定性能上限,优化方法决定实际表现”的核心规律。原创 2025-09-19 22:43:45 · 883 阅读 · 0 评论 -
从 “机械化” 到 “自动化”:机器学习的边界与突破
从机器学习到深度学习的过渡原创 2025-09-17 08:49:56 · 927 阅读 · 0 评论
分享