这个怎么做 琢磨一下

  1. Browse for and select the prjBookmarkmgr.dll using the 'Add From File' button on the Customize dialog. Place the button somewhere on a toolbar.
Ai的理论学习了最小二乘法 逻辑回归懂了激活函数损失函数梯度下降能手算简单的情景 之后学习了CNN了解到CNN就是提前卷积处理了数据再给到神经网络学习用softmax激活取概率最大的分类 学了RNN的理论 设定一个权重矩阵和偏置向量 让每一时间步的输入都乘权重矩阵再加偏置向量经过激活函数得到输出 缺点是有几个时间步就要有几层神经网络容易梯度爆炸或梯度消失还有记不住长期的信息 所以出现了LSTM 长短期记忆神经网络核心思想可以理解成有一个水池 每次时间步给水池里先把水排出去就是经过遗忘门 再给水池里把新的水加上也就是把新的信息加上去 再把整个水池的信息经过激活函数输出 这就有了长期记忆了 今天学了transformer的理论 先把序列元素当成一个个的词 把词设置为多维向量 比如512维度 再搞位置向量 位置向量用第几个词 第几维度 通过sin和cos函数计算并且位置向量是唯一的不会有重复的 把词向量和位置向量相加得到嵌入向量 再设三个未知权重的矩阵 用嵌入向量和三个矩阵相乘得到QKV用每一个Q和每一个K做点积就是Q的模乘K的模再乘夹角余弦值 结果越大表示越相似相关性越强再经过softmax得到权重与V相乘再经过一个权重矩阵加偏置就拿到的输入数据 如果设定多组QKV均分维度比如8租QKV每一组处理512维中的64维 再把处理好的组合成512维就是多头注意力 再把输入数据经过一个两层的神经网络 第一个层权重矩阵可以是512行2048列对输入数据进行升维 第二层权重矩阵可以是2048行512列再降维 得到的结果再经过激活函数得到输出 对这整个过程梯度下降 我自己琢磨了未知数的层数 至少是五层 第一层是词向量未知需要学习 第二层是为了得到QKV的计算矩阵 第三层是与V相乘的权重矩阵 后两层是前馈神经网络的两层所以至少五层。以上是我理论的掌握 我还是一个三年后端开发经验的工程师 java springboot nodejs sql 消息队列 定时任务 都做过业务 我学了以上AI理论后发展无岗位可以投递 我在招聘软件搜索AI应用开发 大多都是langchian rag agent 故而有以上问题问你 你说单纯依赖LangChain/RAG/Agent的岗位可能收缩 现在我卡住了不知如何继续进展了
最新发布
07-24
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值