在大数据分析Python语音转文字教程中,我将演示如何使用Python将语音转换为文本。这可以借助“语音识别” API和“ PyAudio”库来完成。

语音是最常见的交流手段,世界上大多数人口都依靠语音相互交流。语音识别系统基本上将口语翻译成文本。语音识别系统有很多现实的例子。例如,Apple SIRI可以识别语音并将其截断为文本。

语音识别如何工作?

4255-200F211023DR.png

隐马尔可夫模型(HMM)是一种深度神经网络模型,用于将音频转换为文本。完整的详细过程已超出大数据分析Python语音转文字教程的范围。在大数据分析Python语音转文字教程中,我将演示如何使用Python将语音转换为文本。这可以借助“ 语音识别” API和“ PyAudio ”库来完成。

语音识别API支持多个API,在大数据分析Python语音转文字教程中,我使用了百度语音识别API。有关更多详细信息,请检查 此。它有助于将语音转换为文本的翻译。

Python库

4255-200F2110323551.png

将音频文件转换为文本

脚步:

导入语音识别库

初始化识别器类以识别语音。我们正在使用谷歌语音识别。

语音识别支持的音频文件: wav,AIFF,AIFF-C,FLAC。 在此示例中,我使用了“ wav”文件

我用过“拍摄的”电影音频剪辑,上面写着 “我不知道你是谁,如果你要赎金,我不知道你想要什么,我可以告诉你我没有钱”

默认情况下,百度识别器会读取英语。它支持不同的语言,有关更多详细信息,请参阅此文档。

4255-200F2110352B5.png

输出量

4255-200F21104162Y.png

如何转换不同的音频语言?

例如,如果我们要阅读法语音频文件,则需要在recogonize_百度中添加语言选项。其余代码保持不变。请参考更多 文档

4255-200F2110459393.png

输出量

4255-200F2110520R5.png

麦克风语音转换成文字

脚步:

1、我们需要安装PyAudio库,该库用于通过麦克风和扬声器接收音频输入和输出。基本上,它有助于使我们的声音通过麦克风传播。

4255-200F2110551937.png

2、代替音频文件源,我们必须使用Microphone类。其余步骤相同。

4255-200F21106141N.png

我刚刚说过“你好吗?”

输出量

4255-200F2110635494.png

用另一种语言说话怎么样?

同样,我们需要在Recognize_百度()中添加所需的语言选项。我正在用泰米尔语(印度语)交谈,并在语言选项中添加“ ta-IN”。

4255-200F2110AC35.png

我只是在泰米尔语中说“你好”,它准确地在泰米尔语中打印了文字。

输出量

4255-200F2110G4R6.png

注意:

百度语音识别API是将语音转换为文本的简便方法,但需要互联网连接才能运行。

在大数据分析Python语音转文字教程中,我们了解了如何使用百度语音识别API将语音转换为文本。这对于NLP项目尤其是处理音频笔录数据非常有帮助。如果您要添加任何内容,请随时发表评论!

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐