-
TFCudnnLSTM: 一个简单模板,用于TensorFlow中高效CudnnLSTM模块的实现
资源介绍
TFCudnnLSTM
TensorFlow的高效CudnnLSTM模块的简单模板
依存关系
TensorFlow v1.8 +
CUDA v9.0 +
cuDNN v7.0 +
scikit学习
tqdm
计算性能
TensorFlow的性能指南包括 ,其中指出:
在NVIDIA GPU上,始终应首选使用tf.contrib.cudnn_rnn除非您需要不支持的图层归一化。
根据,与TensorFlow的其他LSTM实现相比, CudnnLSTM实现了显着的加速(比LSTMBlockFused快约2倍,比BasicLSTM快约5倍)。
语言建模实验
我们还采用并尝试运行在那里实现的三个LSTM版本: BasicLSTMCell , LSTMBlockCell和CudnnLSTM 。 我们发现由于API的更改, CudnnLSTM示例无法在TF v1.8中运行,但是在解决了一些
- 上一篇: time_convolution:时间卷积
- 下一篇: 外汇自动交易系统(神经网络)