Github项目

masr:基于深度神经网络的中文语音识别项目

masr是一个基于端到端深度神经网络的中文普通话语音识别项目。它使用门控卷积神经网络,激活函数为GLU,用AISHELL - 1数据集训练。在GTX1080Ti单卡上迭代一个epoch约20分钟,验证...

标签:

【Github】项目名:masr:基于深度神经网络的中文语音识别项目

项目简介

masr是一个基于端到端的深度神经网络的中文普通话语音识别项目。它使用门控卷积神经网络(Gated Convolutional Network),激活函数为GLU(门控线性单元),网络结构类似于Facebook在2016年提出的Wav2letter。模型使用AISHELL – 1数据集训练,共150小时的录音,覆盖4000多个汉字。在单卡GTX1080Ti上,模型每迭代一个epoch大约需要20分钟,目前验证集CER已下降到11%,测试集CER稍高为14%,外接语言模型可将测试集CER降低到8%,项目提供的预训练模型接近最佳。

项目总结

这个masr项目为研究卷积网络用于语音识别效果提供了参考,但由于数据量等因素不能与工业界识别效果相比。欢迎大家留言分享对这个项目的看法和见解。

项目地址

GitHub链接直达

数据统计

数据评估

masr:基于深度神经网络的中文语音识别项目浏览人数已经达到8,如你需要查询该站的相关权重信息,可以点击"5118数据""爱站数据""Chinaz数据"进入;以目前的网站数据参考,建议大家请以爱站数据为准,更多网站价值评估因素如:masr:基于深度神经网络的中文语音识别项目的访问速度、搜索引擎收录以及索引量、用户体验等;当然要评估一个站的价值,最主要还是需要根据您自身的需求以及需要,一些确切的数据则需要找masr:基于深度神经网络的中文语音识别项目的站长进行洽谈提供。如该站的IP、PV、跳出率等!

关于masr:基于深度神经网络的中文语音识别项目特别声明

本站链氪巴士提供的masr:基于深度神经网络的中文语音识别项目都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由链氪巴士实际控制,在2024年12月6日 上午12:00收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,链氪巴士不承担任何责任。

相关导航

暂无评论

暂无评论...