ASRT_SpeechRecognition/asrserver.py

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
@author: nl8590687
语音识别API的HTTP服务器程序

"""
import http.server
import urllib
import keras
from SpeechModel251 import ModelSpeech
from LanguageModel import ModelLanguage

datapath = './'
modelpath = 'model_speech/'
ms = ModelSpeech(datapath)
ms.LoadModel(modelpath + 'm251/speech_model251_e_0_step_12000.model')

ml = ModelLanguage('model_language')
ml.LoadModel()

class TestHTTPHandle(http.server.BaseHTTPRequestHandler):  
	def setup(self):
		self.request.settimeout(10)
		http.server.BaseHTTPRequestHandler.setup(self)
	
	def _set_response(self):
		self.send_response(200)
		self.send_header('Content-type', 'text/html')
		self.end_headers()
		
	def do_GET(self):  
	
		buf = 'ASRT_SpeechRecognition API'  
		self.protocal_version = 'HTTP/1.1'   
		
		self._set_response()
		
		buf = bytes(buf,encoding="utf-8")
		self.wfile.write(buf) 
		
	def do_POST(self):  
		'''
		处理通过POST方式传递过来并接收的语音数据
		通过语音模型和语言模型计算得到语音识别结果并返回
		'''
		path = self.path  
		print(path)  
		#获取post提交的数据  
		datas = self.rfile.read(int(self.headers['content-length']))  
		#datas = urllib.unquote(datas).decode("utf-8", 'ignore') 
		datas = datas.decode('utf-8')
		datas_split = datas.split('&')
		token = ''
		fs = 0
		wavs = []
		#type = 'wavfilebytes' # wavfilebytes or python-list
		
		for line in datas_split:
			[key, value]=line.split('=')
			if('wavs' == key and '' != value):
				wavs.append(int(value))
			elif('fs' == key):
				fs = int(value)
			elif('token' == key ):
				token = value
			#elif('type' == key):
			#	type = value
			else:
				print(key, value)
			
		if(token != 'qwertasd'):
			buf = '403'
			print(buf)
			buf = bytes(buf,encoding="utf-8")
			self.wfile.write(buf)  
			return
		
		#if('python-list' == type):
		if(len(wavs)>0):
			r = self.recognize([wavs], fs)
		else:
			r = ''
		#else:
		#	r = self.recognize_from_file('')
		
		if(token == 'qwertasd'):
			#buf = '成功\n'+'wavs:\n'+str(wavs)+'\nfs:\n'+str(fs)
			buf = r
		else:
			buf = '403'
		
		#print(datas)
		
		self._set_response()
		
		#buf = '<!DOCTYPE HTML> \n<html> \n<head>\n<title>Post page</title>\n</head> \n<body>Post Data:%s  <br />Path:%s\n</body>  \n</html>'%(datas,self.path)  
		print(buf)
		buf = bytes(buf,encoding="utf-8")
		self.wfile.write(buf)  
		
	def recognize(self, wavs, fs):
		r=''
		try:
			r_speech = ms.RecognizeSpeech(wavs, fs)
			print(r_speech)
			str_pinyin = r_speech
			r = ml.SpeechToText(str_pinyin)
		except:
			r=''
			print('[*Message] Server raise a bug. ')
		return r
		pass
	
	def recognize_from_file(self, filename):
		pass

import socket

class HTTPServerV6(http.server.HTTPServer):
	address_family = socket.AF_INET6

def start_server(ip, port):  
	
	if(':' in ip):
		http_server = HTTPServerV6((ip, port), TestHTTPHandle)
	else:
		http_server = http.server.HTTPServer((ip, int(port)), TestHTTPHandle)
	
	print('服务器已开启')
	
	try:
		http_server.serve_forever() #设置一直监听并接收请求  
	except KeyboardInterrupt:
		pass
	http_server.server_close()
	print('HTTP server closed')
	
if __name__ == '__main__':
	start_server('', 20000) # For IPv4 Network Only
	#start_server('::', 20000) # For IPv6 Network
add language model and server and fix bugs 2018-04-21 20:50:53 +08:00			`#!/usr/bin/env python3`
			`# -- coding: utf-8 --`
			`"""`
			`@author: nl8590687`
			`语音识别API的HTTP服务器程序`

			`"""`
			`import http.server`
move m2 m21 to trash and test asrserver 2018-04-25 21:18:28 +08:00			`import urllib`
add language model and server and fix bugs 2018-04-21 20:50:53 +08:00			`import keras`
switch model to 251 2018-07-27 14:31:48 +08:00			`from SpeechModel251 import ModelSpeech`
fix a great deal bugs 2018-04-26 12:10:34 +08:00			`from LanguageModel import ModelLanguage`
add language model and server and fix bugs 2018-04-21 20:50:53 +08:00
Add IPv6 support to asrserver 2019-01-09 16:37:10 +08:00			`datapath = './'`
fix bugs and improve asrserver 2018-05-11 16:56:59 +08:00			`modelpath = 'model_speech/'`
			`ms = ModelSpeech(datapath)`
优化data_generator代码 2019-01-19 11:27:57 +08:00			`ms.LoadModel(modelpath + 'm251/speech_model251_e_0_step_12000.model')`
fix bugs and improve asrserver 2018-05-11 16:56:59 +08:00
			`ml = ModelLanguage('model_language')`
			`ml.LoadModel()`
add language model and server and fix bugs 2018-04-21 20:50:53 +08:00
			`class TestHTTPHandle(http.server.BaseHTTPRequestHandler):`
将asrserver切换到speechmodel25，并增强鲁棒性 2018-07-05 16:34:35 +08:00			`def setup(self):`
			`self.request.settimeout(10)`
			`http.server.BaseHTTPRequestHandler.setup(self)`
add language model and server and fix bugs 2018-04-21 20:50:53 +08:00
			`def _set_response(self):`
			`self.send_response(200)`
			`self.send_header('Content-type', 'text/html')`
			`self.end_headers()`

			`def do_GET(self):`

			`buf = 'ASRT_SpeechRecognition API'`
			`self.protocal_version = 'HTTP/1.1'`

			`self._set_response()`

			`buf = bytes(buf,encoding="utf-8")`
			`self.wfile.write(buf)`

			`def do_POST(self):`
			`'''`
			`处理通过POST方式传递过来并接收的语音数据`
			`通过语音模型和语言模型计算得到语音识别结果并返回`
			`'''`
			`path = self.path`
			`print(path)`
			`#获取post提交的数据`
			`datas = self.rfile.read(int(self.headers['content-length']))`
move m2 m21 to trash and test asrserver 2018-04-25 21:18:28 +08:00			`#datas = urllib.unquote(datas).decode("utf-8", 'ignore')`
			`datas = datas.decode('utf-8')`
			`datas_split = datas.split('&')`
			`token = ''`
			`fs = 0`
			`wavs = []`
fix bugs and do some test 2018-05-08 11:35:18 +08:00			`#type = 'wavfilebytes' # wavfilebytes or python-list`
move m2 m21 to trash and test asrserver 2018-04-25 21:18:28 +08:00
			`for line in datas_split:`
			`[key, value]=line.split('=')`
修复了语言模型的概率计算错误的Bug，并提高API服务器的健壮性 2018-06-07 12:48:31 +08:00			`if('wavs' == key and '' != value):`
move m2 m21 to trash and test asrserver 2018-04-25 21:18:28 +08:00			`wavs.append(int(value))`
			`elif('fs' == key):`
fix a great deal bugs 2018-04-26 12:10:34 +08:00			`fs = int(value)`
move m2 m21 to trash and test asrserver 2018-04-25 21:18:28 +08:00			`elif('token' == key ):`
			`token = value`
fix bugs and do some test 2018-05-08 11:35:18 +08:00			`#elif('type' == key):`
			`# type = value`
modify asrserver 2018-04-25 21:55:34 +08:00			`else:`
			`print(key, value)`
move m2 m21 to trash and test asrserver 2018-04-25 21:18:28 +08:00
修复了语言模型的概率计算错误的Bug，并提高API服务器的健壮性 2018-06-07 12:48:31 +08:00			`if(token != 'qwertasd'):`
			`buf = '403'`
			`print(buf)`
			`buf = bytes(buf,encoding="utf-8")`
			`self.wfile.write(buf)`
			`return`

fix bugs and do some test 2018-05-08 11:35:18 +08:00			`#if('python-list' == type):`
修复了语言模型的概率计算错误的Bug，并提高API服务器的健壮性 2018-06-07 12:48:31 +08:00			`if(len(wavs)>0):`
			`r = self.recognize([wavs], fs)`
			`else:`
			`r = ''`
fix bugs and do some test 2018-05-08 11:35:18 +08:00			`#else:`
			`# r = self.recognize_from_file('')`
modify asrserver 2018-04-25 21:55:34 +08:00
			`if(token == 'qwertasd'):`
			`#buf = '成功\n'+'wavs:\n'+str(wavs)+'\nfs:\n'+str(fs)`
fix bugs and improve asrserver 2018-05-11 16:56:59 +08:00			`buf = r`
move m2 m21 to trash and test asrserver 2018-04-25 21:18:28 +08:00			`else:`
			`buf = '403'`

			`#print(datas)`
add language model and server and fix bugs 2018-04-21 20:50:53 +08:00
			`self._set_response()`

modify asrserver 2018-04-25 21:55:34 +08:00			`#buf = '<!DOCTYPE HTML> \n<html> \n<head>\n<title>Post page</title>\n</head> \n<body>Post Data:%s <br />Path:%s\n</body> \n</html>'%(datas,self.path)`
修复了语言模型的概率计算错误的Bug，并提高API服务器的健壮性 2018-06-07 12:48:31 +08:00			`print(buf)`
fix bugs and do some test 2018-05-08 11:35:18 +08:00			`buf = bytes(buf,encoding="utf-8")`
modify asrserver 2018-04-25 21:55:34 +08:00			`self.wfile.write(buf)`

fix a great deal bugs 2018-04-26 12:10:34 +08:00			`def recognize(self, wavs, fs):`
修复了语言模型的概率计算错误的Bug，并提高API服务器的健壮性 2018-06-07 12:48:31 +08:00			`r=''`
			`try:`
			`r_speech = ms.RecognizeSpeech(wavs, fs)`
			`print(r_speech)`
			`str_pinyin = r_speech`
			`r = ml.SpeechToText(str_pinyin)`
			`except:`
			`r=''`
			`print('[*Message] Server raise a bug. ')`
modify asrserver 2018-04-25 21:55:34 +08:00			`return r`
			`pass`
add language model and server and fix bugs 2018-04-21 20:50:53 +08:00
fix bugs and do some test 2018-05-08 11:35:18 +08:00			`def recognize_from_file(self, filename):`
			`pass`
Add IPv6 support to asrserver 2019-01-09 16:37:10 +08:00
			`import socket`

			`class HTTPServerV6(http.server.HTTPServer):`
			`address_family = socket.AF_INET6`

add language model and server and fix bugs 2018-04-21 20:50:53 +08:00			`def start_server(ip, port):`
Add IPv6 support to asrserver 2019-01-09 16:37:10 +08:00
			`if(':' in ip):`
			`http_server = HTTPServerV6((ip, port), TestHTTPHandle)`
			`else:`
			`http_server = http.server.HTTPServer((ip, int(port)), TestHTTPHandle)`

add language model and server and fix bugs 2018-04-21 20:50:53 +08:00			`print('服务器已开启')`

			`try:`
			`http_server.serve_forever() #设置一直监听并接收请求`
			`except KeyboardInterrupt:`
			`pass`
			`http_server.server_close()`
			`print('HTTP server closed')`

			`if __name__ == '__main__':`
Add IPv6 support to asrserver 2019-01-09 16:37:10 +08:00			`start_server('', 20000) # For IPv4 Network Only`
			`#start_server('::', 20000) # For IPv6 Network`
add language model and server and fix bugs 2018-04-21 20:50:53 +08:00