Go to file

nl8590687 1425994db3 修改了模型5的参数初始化		2018-04-08 16:22:46 +08:00
general_function	修改了数据的输入	2018-04-04 22:16:07 +08:00
neural_network	CTC基本实现，开始修复涉及数据的代码bug	2018-03-28 17:34:22 +08:00
.gitignore	update daily 20170829	2017-08-30 00:15:03 +08:00
LICENSE	add license and gitignore.modify py code main.py	2017-08-22 17:56:05 +08:00
README.md	修改了一下模型试试20180403	2018-04-03 14:28:35 +08:00
SpeechModel.py	try 20180407_0	2018-04-07 14:47:40 +08:00
SpeechModel2.py	修改了模型5的参数初始化	2018-04-08 16:22:46 +08:00
SpeechModel3.py	修改了模型5的参数初始化	2018-04-08 16:22:46 +08:00
SpeechModel4.py	修改了模型5的参数初始化	2018-04-08 16:22:46 +08:00
SpeechModel5.py	修改了模型5的参数初始化	2018-04-08 16:22:46 +08:00
SpeechModel_old.py	CTC基本实现，开始修复涉及数据的代码bug	2018-03-28 17:34:22 +08:00
log.md	修改网络模型20180405_0	2018-04-05 16:45:55 +08:00
readdata.py	try 20180407_0	2018-04-07 14:47:40 +08:00
readdata2.py	try 20180407_0	2018-04-07 14:47:40 +08:00
readdata3.py	try 20180407_0	2018-04-07 14:47:40 +08:00
readdata4.py	try 20180407_0	2018-04-07 14:47:40 +08:00

ASRT_SpeechRecognition

基于深度学习的语音识别系统

Introduction 简介

本项目使用Keras、TensorFlow基于长短时记忆神经网络和卷积神经网络以及CTC进行制作。

This project uses keras, TensorFlow based on LSTM, CNN and CTC to implement.

本项目目前已经可以进行训练了，不过训练时loss一直高居不下。

本项目运行请执行：

$ python3 SpeechModel.py

CNN + LSTM + CTC

基于概率图的马尔可夫模型

Python的依赖库

清华大学THCHS30中文语音数据集

特别鸣谢！感谢前辈们的公开语音数据集

日志