diff --git a/general_function/file_dict.py b/general_function/file_dict.py index cc1ac71..336d404 100644 --- a/general_function/file_dict.py +++ b/general_function/file_dict.py @@ -3,9 +3,9 @@ ''' 获取符号字典列表的程序 ''' +import platform as plat - -def GetSymbolList(datapath): +def GetSymbolList_trash(datapath): ''' 加载拼音符号列表,用于标记符号 返回一个列表list类型变量 @@ -27,3 +27,35 @@ def GetSymbolList(datapath): #SymbolNum = len(list_symbol) return list_symbol +def GetSymbolList(datapath): + ''' + 加载拼音符号列表,用于标记符号 + 返回一个列表list类型变量 + ''' + + datapath_ = datapath.strip('dataset\\') + + system_type = plat.system() # 由于不同的系统的文件路径表示不一样,需要进行判断 + if (system_type == 'Windows'): + datapath_+='\\' + elif (system_type == 'Linux'): + datapath_ += '/' + else: + print('*[Message] Unknown System\n') + datapath_ += '/' + + txt_obj=open(datapath_ + 'dict.txt','r',encoding='UTF-8') # 打开文件并读入 + txt_text=txt_obj.read() + txt_lines=txt_text.split('\n') # 文本分割 + list_symbol=[] # 初始化符号列表 + for i in txt_lines: + if(i!=''): + txt_l=i.split('\t') + list_symbol.append(txt_l[0]) + txt_obj.close() + list_symbol.append('_') + #SymbolNum = len(list_symbol) + return list_symbol + +if(__name__ == '__main__'): + GetSymbolList('E:\\abc\\') \ No newline at end of file