WHCSRL 技术网

python-语音识别

使用pyttsx的python包,你可以将文本转换为语音。

安装命令

pip install pyttsx3 -i https://pypi.tuna.tsinghua.edu.cn/simple

运行一个简单的语音 ‘大家好’。

  1. import pyttsx3 as pyttsx
  2. engine = pyttsx.init() #初始化
  3. engine.say('大家好')
  4. engine.runAndWait()

另一种文本转语音方法。

  1. from win32com.client import Dispatch
  2. speaker = Dispatch('SAPI.SpVoice') #创建Dispatch对象
  3. speaker.Speak('大家好') #调用Speak方法
  4. del speaker #释放

这种方法可能会报错,

ImportError: DLL load failed while importing win32api: 找不到指定的模块。

网站下载与自己安装的 “Python" 版本相适应的 "pywin32" 安装程序。

使用SpeechLib完成文本转换语言

  1. from comtypes.client import CreateObject
  2. from comtypes.gen import SpeechLib
  3. engine = CreateObject('SAPI.SpVoice') #调用方法
  4. stream = CreateObject('SAPI.SpFileStream') #输出到目标对象的流
  5. infile = '1.txt' #要读取的文本
  6. outfile = 'demo_audio.wav' #输出到语音文件
  7. stream.open(outfile,SpeechLib.SSFMCreateForWrite)
  8. engine.AudioOutputStream = stream
  9. #读取文本内容
  10. f = open(infile,'r',encoding='utf-8')
  11. theText = f.read()
  12. f.close()
  13. engine.speak(theText)
  14. stream.close()

使用PocketSphinx将语音转换成文本

首先安装两个工具包

  1. pip install PocketSphinx
  2. pip install SpeechRecognition

然后下载cmusphinx-zh-cn-5.2.tar中文识别的放到anaconda的python虚拟环境的目录下

Libsite-packagesspeech_recognitionpocketsphinx-data路径下

解压文件重命名为zh-CN

  1. #将语音转换成文本 使用PocketSphinx
  2. import speech_recognition as sr
  3. audio_file = 'demo_audio.wav'
  4. r = sr.Recognizer()
  5. with sr.AudioFile(audio_file) as source: #打开语音文件并读取
  6. audio = r.record(source)
  7. try:
  8. print('文本内容:',r.recognize_sphinx(audio)) #默认识别成英文
  9. print('文本内容:',r.recognize_sphinx(audio,language='zh-CN')) #指定中文
  10. except Exception as e:
  11. print(e)

推荐阅读