Go to file
nl8590687 09607561cc fix bugs 2018-04-28 15:48:15 +08:00
general_function fix a great deal bugs 2018-04-26 12:10:34 +08:00
neural_network CTC基本实现,开始修复涉及数据的代码bug 2018-03-28 17:34:22 +08:00
trash move m2 m21 to trash and test asrserver 2018-04-25 21:18:28 +08:00
.gitignore 修复了内存泄漏的bug,添加和修改了部分数据 2018-04-28 14:10:30 +08:00
LICENSE add license and gitignore.modify py code main.py 2017-08-22 17:56:05 +08:00
LanguageModel.py 补充语言模型和端到端测试脚本 2018-04-25 19:50:32 +08:00
README.md move m2 m21 to trash and test asrserver 2018-04-25 21:18:28 +08:00
SpeechModel22.py 修复了内存泄漏的bug,添加和修改了部分数据 2018-04-28 14:10:30 +08:00
SpeechModel23.py 修复了内存泄漏的bug,添加和修改了部分数据 2018-04-28 14:10:30 +08:00
asrserver.py fix a great deal bugs 2018-04-26 12:10:34 +08:00
dict.txt fix bugs 2018-04-28 15:48:15 +08:00
log.md move m2 m21 to trash and test asrserver 2018-04-25 21:18:28 +08:00
readdata22.py 补充语言模型和端到端测试脚本 2018-04-25 19:50:32 +08:00
readdata22_2.py fix bugs 2018-04-28 15:48:15 +08:00
readdata23.py add language model and server and fix bugs 2018-04-21 20:50:53 +08:00
test.py 补充语言模型和端到端测试脚本 2018-04-25 19:50:32 +08:00

README.md

ASRT_SpeechRecognition

基于深度学习的语音识别系统

Introduction 简介

本项目使用Keras、TensorFlow基于长短时记忆神经网络和卷积神经网络以及CTC进行制作。

This project uses keras, TensorFlow based on LSTM, CNN and CTC to implement.

本项目目前已经可以正常进行训练了。

本项目运行请执行:

$ python3 SpeechModel22.py

Model 模型

Speech Model 语音模型

CNN + LSTM + CTC

Language Model 语言模型

基于概率图的马尔可夫模型

Python Import

Python的依赖库

  • python_speech_features
  • TensorFlow
  • Keras
  • Numpy
  • wave
  • matplotlib
  • math
  • Scipy
  • h5py

Data Sets 数据集

  • 清华大学THCHS30中文语音数据集

data_thchs30.tgz http://cn-mirror.openslr.org/resources/18/data_thchs30.tgz

test-noise.tgz http://cn-mirror.openslr.org/resources/18/test-noise.tgz

resource.tgz http://cn-mirror.openslr.org/resources/18/resource.tgz

  • Free ST Chinese Mandarin Corpus

ST-CMDS-20170001_1-OS.tar.gz http://cn-mirror.openslr.org/resources/38/ST-CMDS-20170001_1-OS.tar.gz

特别鸣谢!感谢前辈们的公开语音数据集

Log

日志

链接:进展日志