masr是一个基于端到端深度神经网络的中文普通话语音识别项目。它使用门控卷积神经网络,激活函数为GLU,用AISHELL - 1数据集训练。在GTX1080Ti单卡上迭代一个epoch约20分钟,验证集CER达11%,测试集CER为14%,外接语言模型可降至8%,提供预训练模型。虽然不能与工业界效果相比,但可作为研究卷积网络用于语音识别效果的参考。