自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 [特殊字符] 深入剖析 AI 大模型的位置编码原理:从理论到实践 [特殊字符]

在自然语言处理(NLP)的星辰大海中,Transformer 架构犹如一艘超级战舰,而就是它的导航系统!本文将带你深入探索这个让AI理解"顺序"奥秘的黑科技~💡 你知道吗?没有位置编码,Transformer会把"猫追狗"和"狗追猫"当成一回事!

2025-04-16 13:47:26 221

原创 [特殊字符] 大模型微调实战:通过 LoRA 微调修改模型自我认知 [特殊字符]✨

本文通过一个有趣的Demo,展示了如何使用LLaMAFactory进行LoRA微调:准备模型和数据集注册数据集执行微调分析训练结果测试模型效果💡 小贴士:微调就像教AI说"方言",既要保留通用能力,又要学会特定表达。调参就像烹饪,火候很重要哦!🤔 思考题:如果你想教AI用莎士比亚风格写作,该怎么准备数据集呢?📚 相关资源Qwen模型库。

2025-04-16 13:43:00 427

原创 [特殊字符] LoRA微调大模型实践:从MAC到Web的全流程指南

今天我们要在MAC上完成一个完整的AI项目闭环:微调一个大模型 → 2. 导出模型并部署 → 3. 暴露API给web后端 → 4. 前端展示框架:LLama-Factory 🏭算法:LoRA (低秩适应) 🧠基座模型: (来自HuggingFace)# 如果下载失败的话,可以手动下载压缩包git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.gitcd LLaMA-Factory# 下载依赖包pip install -e &

2025-04-15 21:07:36 554

原创 [特殊字符]手把手教你在 Windows 系统上搭建大模型训练环境

通过以上步骤,你已经成功搭建了大模型训练环境!就像准备好了一间设备齐全的厨房,现在可以开始烹饪你的"AI大餐"了!下一步建议尝试运行简单的深度学习示例逐步增加模型复杂度加入AI社区交流经验🌟祝你在大模型训练的探索之旅中收获满满!如果在实践中遇到问题,记住:每个错误都是通向精通的阶梯~

2025-04-15 21:01:55 323

原创 [特殊字符] Spring AI实战:Stdio方式玩转MCP服务调用 [特殊字符]

大模型应用开发Spring AI实战-开发自己的MCP应用:大模型应用开发Spring AI实战-Stdio方式实现MCP服务调用通过实际代码案例,逐步掌握Java生态下的AI大模型应用产品开发!

2025-04-15 13:37:18 596

原创 [特殊字符] 大模型推理全攻略:从显存占用到合规输出 [特殊字符]

Q/K/V矩阵占满显存空间:缓存K/V加速解码导致显存持续占用。

2025-04-15 13:30:27 679

原创 [特殊字符] 前端SSE流式传输技术:对话大模型的最佳拍档!

Server-Sent Events (SSE) 是一种允许服务器主动推送消息给客户端的技术。和WebSocket这个"电话"(双向通信)不同,SSE更像是个"广播喇叭"(单向通信),特别适合服务器需要不断推送信息的场景。技术特点📡 基于HTTP协议(不像WebSocket需要额外协议)🔄 每次消息发送后连接会关闭,客户端需要重新连接✉️ 消息格式有严格规范(后面会详细讲解)服务端升级版// 添加自定义事件客户端监听。

2025-04-14 13:45:33 402

原创 [特殊字符] 大模型评测全攻略:从原理到实践

大模型评测正在从静态的基准测试向动态的、多维度的综合评估演进。未来,随着多模态、具身智能等技术的发展,评测体系还将持续升级。希望这篇文章能帮助你全面了解大模型评测的前沿方法!你对大模型评测还有什么疑问?欢迎在评论区留言讨论!👇💡小测验:你认为下列哪种评测方式最能反映模型的真实水平?A) 标准试题测试 B) 开放域聊天评估 C) 多轮任务解决 D) 创意写作挑战快在评论区留下你的答案吧!

2025-04-14 13:36:02 718

原创 [特殊字符] 大模型训练显存计算完全指南:从入门到精准估算 [特殊字符]

KV Cache显存 = 2 × batch × seq_len × hidden_dim × layers ×精度 / (TP×PP×DP)激活值显存 = batch×seq_len×hidden_dim×系数×layers×精度 / (TP×PP×DP)激活复杂度系数 = 34 + (5×seq_len×heads)/hidden_dim。模型参数显存 = 参数数量 × 精度字节数 / (TP大小 × PP大小)7e9 × 2字节 / (2×2) = 3.5GB。用时间换空间,激活值显存减少60%+

2025-04-13 14:00:00 1034

原创 [特殊字符] AI大模型Prompt工程实战指南:从入门到专家级技巧 [特殊字符]

"content": "你是一位资深金融分析师,用专业术语回答,数据需精确到小数点后两位""content": "特斯拉Q3现金流为$3.2B,同比增长25%...":避免开放式Prompt如"随便写首诗",要明确"写一首七言绝句,主题是春天""content": "请分析特斯拉Q3财报的现金流情况"问题:"如果3个苹果价格是5元,买12个需要多少钱?输出:"苹果公司(纳斯达克代码:AAPL)"前置上下文:"作为财务专家,请分析..."输入:"请生成5个不同风格的Prompt,

2025-04-13 13:45:00 630

原创 [特殊字符] 一文吃透LangChain:大模型应用开发的瑞士军刀 [特殊字符]

2025年AI领域最火框架:LangChain就像给大模型装上"四肢",让它们不再只是聊天机器人,而是能真正帮你干活的数字员工!本文用最"美味"的方式带你全盘掌握~

2025-04-12 13:58:35 417

原创 [特殊字符] 一文带你搞懂AI大模型技术版图(附超全脑图)[特殊字符]

2022年11月ChatGPT横空出世,到现在AI技术已经像野火一样燎原!无论你是想:开发智能APP提升工作效率 💼避免被技术浪潮拍在沙滩上 🏄单纯想装个高科技X 🤖——掌握几个按钮(技术栈),你也能做出惊艳的"数字料理"!今天就用最香辣的方式,带你吃透AI大模型技术版图!

2025-04-12 13:51:19 799

原创 [特殊字符] AI大模型应用开发实战:RAG-Agent技术深度解析

在人工智能技术飞速发展的今天,作为结合了与技术的创新项目,展现出了独特的优势与潜在的弊端。深入剖析其未来发展,有助于我们更好地理解这一技术在实际应用中的潜力与挑战。

2025-04-11 13:43:31 396

原创 [特殊字符] 大模型与传统模型的结合:从技术互补到行业变革

可行性评估:当前技术已实现大模型"指导"小模型训练,未来5年内或将出现完全自动化的小模型生成系统挑战与突破:需解决生成数据的质量控制、算力成本分摊以及伦理监管框架的完善IDC预测:到2028年,70%的企业级AI模型将由大模型自动孵化!

2025-04-11 13:37:25 625

原创 [特殊字符] 学大模型必看!手把手带你从零微调大模型(完整实战指南)

想象一下,大模型就像毛坯房,微调就是精装修!我们将在Yi开源大模型基础上进行改造:🖥️无需高配电脑:使用阿里魔塔社区免费GPU资源🆓薅羊毛指南:新用户送几十小时GPU时长🚀全程浏览器操作:有网就能玩转AI💡 温馨提示:本文重点在流程体验,技术细节我们后续再深入~

2025-04-10 21:41:58 559

原创 [特殊字符] 使用LLaMA-Factory快速训练你的专属大模型:从入门到“脑筋急转弯“大师

看完是不是手痒了?"听不如见,见不如做"——赶紧动手,才能真正掌握!遇到问题随时留言,我会化身AI急救员来帮你~ 💪。

2025-04-10 21:23:11 530

原创 [特殊字符] 大模型Docker技术深度解析:从GPU受限到万亿模型训练实战

太极AngelPTM的核心价值✅ 更少资源 → 更大模型✅ 极致效率 → 更快训练✅ 统一架构 → 更简运维未来展望多模态大模型训练边缘设备轻量化部署自动超参数优化。

2025-04-09 20:17:07 773

原创 [特殊字符] NLP大模型 & CV大模型实战指南:从0到1构建多模态AI系统

通过这六个步骤,我们完成了一个多模态AI系统的完整生命周期!数据是根基:质量决定上限模型是核心:架构影响性能训练需耐心:调参是门艺术部署要稳健:工程化同样重要未来可以尝试:更大规模的预训练模型更复杂的多模态融合策略实时推理优化🌟 互动时间如果你在实现过程中遇到任何问题,或者有更好的改进建议,欢迎在评论区留言交流!

2025-04-09 19:53:14 721 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除