大模型
文章平均质量分 90
在阿里大模型平台工作的前端工程师,用我的视角和经验,带你一步步走进大模型的世界。不堆术语,重逻辑,愿做你通往 AI 时代的引路人
AI前端老薛
阿里集团大模型应用开发者 | 7年资深前端工程师 | 聚焦 LLM + Agent 应用架构与前端交互体验,探索 RAG、AI Agent 与 Web 技术的深度融合。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
用 `@microsoft/fetch-event-source` 实现可靠的 SSE 对话流:从原理到封装实践
摘要:基于 @microsoft/fetch-event-source 实现 AI 对话流式响应 本文探讨了使用 SSE(Server-Sent Events)技术实现 AI 对话流式响应的方法,重点介绍了 @microsoft/fetch-event-source 库的封装实践。原生 EventSource 存在无法发送 POST 请求、错误处理薄弱等缺陷,而 @microsoft/fetch-event-source 通过结合 fetch API 和 SSE 协议,解决了这些问题。文章详细展示了如何封装原创 2025-12-18 16:32:26 · 903 阅读 · 0 评论 -
从“点击按钮”到“AI 理解”:前端工程师也能看懂的 Transformer 全流程
《前端视角:从点击到AI理解的Transformer全流程》 本文以前端工程师视角解析Transformer架构,用通俗类比揭示AI思考过程:1)输入文本通过分词和嵌入层转为向量;2)位置编码标记词序;3)编码器通过自注意力机制(类似JS的map和权重计算)分析词间关系;4)多头注意力像"阅读时圈重点",前馈网络增强语义表达。Transformer的并行处理和全局感知能力使其成为GPT等大模型的基石。前端开发者理解该流程可优化加载动画、调试RAG应用并设计高效Prompt,让AI交互更自原创 2025-11-09 18:45:56 · 913 阅读 · 0 评论 -
从“点击按钮”到“AI 决策”:前端工程师也能看懂的神经网络入门
摘要: 神经网络是一种模仿人脑的数学模型,通过输入数据经多层计算输出结果。它由输入层、隐藏层和输出层组成,通过线性变换和非线性激活函数处理数据,利用反向传播和梯度下降自动调参。前端工程师虽不直接训练模型,但在AI应用中需理解神经网络的输入输出关系,以优化交互设计、提升用户体验。神经网络并非神秘黑盒,而是复杂数学函数的组合,前端作为AI的“眼睛和嘴巴”,需与其协同工作。理解神经网络原理有助于前端开发者在智能客服、推荐系统等场景中更好地与算法协作,实现更高效的人机交互。原创 2025-11-09 15:45:06 · 639 阅读 · 0 评论 -
从“传统模型”到大模型:我们是如何一步步走向智能的
文章摘要:本文探讨了从传统模型到大模型的技术演进历程。传统模型采用"输入→映射→输出"的数学工具模式,通过固定格式的数据训练,在特定领域表现稳定可靠。随着深度学习发展,大模型凭借多模态输入、通用预训练和万亿级参数等优势,实现了从"专业工匠"到"通才学生"的转变。当前行业正致力于构建大模型开发平台和智能Agent系统,推动AI从被动响应向主动思考的进阶。理解这一演进过程,对把握AI技术发展方向具有重要意义。(149字)原创 2025-11-08 18:27:12 · 458 阅读 · 0 评论
分享