- 博客(13)
- 资源 (4)
- 收藏
- 关注
原创 AI大模型的底层原理
AI 大模型的底层原理包括数据预处理、神经网络构建、前向传播、激活函数等多个关键步骤。Transformer 架构通过自注意力机制和前馈神经网络捕捉复杂的语言模式,而激活函数和优化算法则确保模型能够高效学习和泛化。(如 GPT、BERT 等)的底层原理涉及多个关键步骤和技术,包括数据预处理、神经网络构建、前向传播、激活函数等。从多种来源(如网页、书籍、数据库)收集大规模文本数据。将每个词的整数索引转换为稠密向量(词向量)。层归一化:对每层的输出进行归一化,加速训练。Q,K,VQ,K,V:查询、键、值矩阵。
2025-02-19 19:20:19
908
原创 NLP早起发展历史
1、One-hot编码:只有1个1,其他都是0。只有one 是hot的。3、N-gram4、分布式5、NNLM:Neural Network Language Model 神经网络语言模型6、Word2Vec,Google团队2013年提出,种用于生成词向量(Word Embedding)的经典算法。
2025-02-16 23:20:42
621
原创 大模型经历了哪些阶段?
大模型的发展经历了从统计方法到深度学习,再到预训练和多模态融合的多个阶段。未来,随着计算资源的增加和算法的优化,大模型将在更多领域发挥重要作用。大模型(Large Models)的发展经历了多个阶段,从早期的统计方法到现代的深度学习模型,每一次技术突破都推动了自然语言处理(NLP)和人工智能(AI)领域的进步。:双向 Transformer,通过掩码语言模型(MLM)和下一句预测(NSP)预训练。:融合文本、图像、音频等多模态信息,实现更通用的 AI。:自回归 Transformer,通过语言模型预训练。
2025-02-14 14:27:59
972
原创 AI相关词汇
GAN:Generative Adversarial Network 生成对抗网络,2014年提出。AI:Artificial Intelligence 人工智能。LLM:Large Language Model 大语言模型。Deep Learning 深度学习,2006年提出。
2025-02-13 20:39:14
97
原创 人生进阶,从培养自己的成长型思维开始
成长型思维中最核心的信念就是:人成年后的智力和能力是可塑的。我们认为这背后是有科学原理的,即行为神经科学最重要的发现之一:我们神经的大脑具有可塑性。其实很幸运的一点是,
2025-01-26 16:04:29
229
原创 学习的过程
艾利克森(Ericsson)发现,决定伟大水平和一般水平的关键因素,既不是天赋,也不是经验,而是刻意练习的程度。2.3 关联:加工包含理解,理解就是把接收来的新信息与大脑中的已知信息建立连接的过程。刻意练习是有适用范围的,比如高考、有人刻意练习8年也不行。有图像的容易记忆、有场景信息的容易记忆、有规律的容易记忆。四、使能(知识与技能、方法与过程、情感与价值)学习知识的过程是反复迭代、不断沉淀的过程。理解知识体系、在整个体系中的位置。一、收集(阅读、听讲、观察)二、加工(理解、探索、实践)
2025-01-26 14:31:19
245
原创 如何挑选小学
好的师资力量对孩子的成长起到至关重要的作用,它不仅影响孩子的学习质量,还是提高学生竞争力的关键。家长在选择学校时,应深入了解教师的教学经验、教育背景以及师资结构与水平,这些因素直接关系到学校的教学质量。同时,一个敬业、有爱心且与家长保持良好沟通的老师,更能确保孩子在家庭和学校两方面都得到全面的关注与指导。不同的学校有不同的教育理念和办学特色,如有的强调素质教育,有的则偏向应试教育。鼓励孩子参与艺术、音乐、戏剧和创造性游戏等活动,这些活动有助于培养孩子的创造力和想象力。
2024-10-05 16:29:09
308
原创 如何熟悉一个系统?
新人入职,需要学习已有系统,作为 landing 的一部分,如何学习?被拉过去参与一个陌生系统的迭代开发或者系统维护(bugfix),如何快速上手?同事离职或转岗,需要把系统交接给你,怎么去接?内心 os:这是一口锅吗?这样的场景多了,就需要去梳理常见问题以及应对方法,方便后续遇到类似场景可以快速应对。本文总结熟悉系统主要分四部分:熟悉学习、熟悉技术、熟悉人、实战。每部分会梳理一些在学习过程中需要解答的问题,这些问题随着经验的积累需要逐步补充完善。
2024-07-15 09:49:59
1264
原创 制作软件架构图:工具和方法论
元素(elements):将系统拆分为一组元素 - 模块、组件、结构体、子系统;关系(relationships):不同元素之间的关系 - 交互、依赖 、继承、组合、聚合;属性(properties):每个元素具备的属性 - 名称、职责、接口、实现限制等;原理(principles):为什么这么设计 - 拆分依据、设计原则、决策原因等。(理解后其实是重要的,比如这样设计的优劣、多个架构选择为什么选这一个)
2024-02-07 14:09:43
1108
1
原创 软件架构笔记
软件架构指软件系统的顶层结构。自己的提法:架构就是骨架结构;是软件系统的骨架结构;可以概括为三点:要素+结构+连接。要素可以是子系统、模块、应用服务;连接:定义模块之间的接口和交互方式、集成机制。本篇是架构篇的开篇,梳理了与架构有关的几个容易混淆的概念,包括系统与子系统、模块与组件、框架与架构,解释了架构的定义。
2024-02-05 19:14:47
866
1
jbpm4 工作流应用开发指南(胡奇) 源代码
2013-04-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人