- 博客(7)
- 收藏
- 关注
原创 某大厂大模型技术面经
另外有了gradient,以及adamW的参数,才能更新W。(补充:当你的前面的条件文本过长时,大模型的输出的几个短文本会被原始的很长的条件文本淹没,继续预测下一个token的话,在模型看起来可能条件仍然是差不多的,此时如果使用greedy search,只选择概率最大的一个token,模型极大可能会将前面已经生成的短文本重新预测成概率最大的文本,以此类推,会一直重复下去。对于分布式训练,特别是大模型训练,通讯的开销是一个性能瓶颈,通讯的位宽减少了一半,就可以加快通讯速度,减少等待时间,提高数据流通效率。
2025-01-02 10:12:37
699
原创 AI产品经理面试19题
是指具有自主行为能力的人工智能系统,能够感知环境、做出决策并采取行动,以实现特定目标。AI Agent通常包括感知模块、决策模块和执行模块,通过不断学习和优化,提升其在不同任务中的表现。
2024-12-30 14:18:44
2953
原创 说实在的,厉害的产品经理都是流程管理高手
✅PRD需求文档案例库(300个)Mark的AI产品经理知识库。✅竞品分析案例(365个)✅B端竞品库(148个)✅产品体验报告(30个)✅产品知识地图(44个)✅竞品分析报告(30个)✅产品架构图(52个)✅产品架构图(37个)✅简历模板(336个)✅产品规划(32个)✅产品运营(29个)✅面试题(1571)
2024-12-27 16:40:03
242
原创 阿里大模型面试真题
是指基于大规模数据和多数量的语言模型。架构:LLM常使用Transformer架构,它是一种基于自注意力机制的序列模型。架构由多个编码器层和解码器层组成,每个层都包含多头自注意力机制和前馈神经网络。这种架构可以捕捉长距离的依赖关系和语言结构,适用于处理大规模语言数据。自注意力机制(Self-Attention):自注意力机制是Transformer架构的核心组件之一。它允许模型在生成每个词时,根据输入序列中的其他词来计算该词的表示。
2024-12-25 10:46:30
1713
原创 浅析多模态大模型的前世今生
Mark的AI产品经理知识库「持续更新」CLIPMark的AI产品经理知识库「持续更新」CLIPCLIP该模型使用大量(约 4 亿)从网页中爬取的图像-文本对(pair)数据进行对比学习训练时,假设一个 batch 有 N 对(图像,文本)对,可以有 N x N 种组合方式,对比学习把原始数据集中的 N 个组合作为正样本(下图对角线),把其他的 N x N - N 种组合作为负样本(下图非对角线)模型训练的目标就是。
2024-12-24 10:07:52
825
原创 ⭕️产品经理需要懂技术吗?懂到什么程度?
Mark的AI产品经理知识库如果不需要,为什么?如果需要,能不能简单介绍一下对于没有技术背景的人怎样达到这个程度,有没有好的方法?或者好的资源可以推荐在许多产品管理角色中,深入的技术专长并非必要条件,有时专注于业务理解与市场洞察可能更有价值。然而,随着互联网和人工智能领域的快速发展,一些新兴的产品经理职位开始要求具备一定的技术基础。是否需要掌握技术,以及需要掌握哪些技术栈,这完全取决于你所选择的产品经理类型。
2024-12-23 12:46:38
2204
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅