- 博客(5)
- 收藏
- 关注
翻译 第一章_数学基础
导数(derivative)代表了在自变量变化趋于无穷小的时候,函数值的变化与自变量的变化的比值。几何意义是这个点的切线。物理意义是该时刻的(瞬时)变化率。注意:在一元函数中,只有一个自变量变动,也就是说只存在一个方向的变化率,这也就是为什么一元函数没有偏导数的原因。在物理学中有平均速度和瞬时速度之说。平均速度有。
2023-10-11 15:42:52
180
原创 libtorch部署时torch::cuda::is_available()为0的解决办法
网上的推荐的搞法是:在“属性 --> 链接器 --> 命令行 --> 其他选项”中添加:/INCLUDE:?或者/INCLUDE:“?或者/INCLUDE:?/INCLUDE:?均没有效果。最终解决办法:/INCLUDE:“?
2023-07-02 13:08:56
758
2
原创 RWKV:在Transformer时代重新定义循环神经网络
Transformer已经彻底改变了几乎所有自然语言处理(NLP)任务,但其在序列长度上的内存和计算复杂度呈二次方增长。相比之下,循环神经网络(RNN)在内存和计算需求上呈线性扩展,但由于并行化和可扩展性的限制,难以达到Transformer相同的性能。我们提出了一种新颖的模型架构,即Receptance Weighted Key Value(RWKV),将Transformer的高效可并行训练与RNN的高效推理相结合。
2023-06-15 15:37:24
1379
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅