
小项目
文章平均质量分 92
麻雀2025
这个作者很懒,什么都没留下…
展开
-
自己实现Op注册到tensorflow-serving
目的是云端算法中执行LSTM部分计算过程的加速,即用cu文件编译出so,用此so中的LSTM类或函数替代tf.LSTMCell进行运算。整个项目见Github,流程见博客,博主也刚入门cuda,欢迎留言探讨~使用自定义操作提供TensorFlow模型TensorFlow预先构建了一个广泛的操作库和操作内核(实现),可针对不同的硬件类型(CPU,GPU等)进行微调。这些操作自动链接到Te...原创 2019-10-17 10:57:43 · 729 阅读 · 0 评论 -
tensorflow注册自己实现的Op
目的是云端算法中执行LSTM部分计算过程的加速,即用cu文件编译出so,用此so中的LSTM类或函数替代tf.LSTMCell进行运算。整个项目见Github,流程见博客,博主也刚入门cuda,欢迎留言探讨~1. 源代码编译tensorflowhttps://www.tensorflow.org/install/source?hl=zh-cn2. 注册OP流程:http://www...原创 2019-10-17 10:56:00 · 826 阅读 · 0 评论 -
LSTM的cuda加速
目的是云端算法中执行LSTM部分计算过程的加速,即用cu文件编译出so,用此so中的LSTM类或函数替代tf.LSTMCell进行运算。整个项目见Github,流程见博客,博主也刚入门cuda,欢迎留言探讨~TensorFlow LSTM benchmarkTensorFlow提供5种LSTM变体:(1)BasicLSTMCell,(2)LSTMCell,(3)LSTMBlockCel...原创 2019-10-17 10:49:36 · 3412 阅读 · 0 评论