html识别文字转语音,万能君工具箱v1.8 - 基于百度AI实现语音转文字/文字转语音/文字识别OCR/翻译...

一、需求分析1、音频转文字：目前市面上的音频转文字大多收费。音频转文字的需求是：上传一段音频，直接识别成文字，对于会议记录的比较好使，注意不是实时的语音识别。2、文字转语音：转的语音不要太生硬。3、截图文字识别(OCR)：截屏完成即可弹出截图所含图片中的文字。4、批量图片文字识别：选择多张图片，直接识别出每张图片的文字。5、复制翻译：看英文文献，有时候懒，如果能有置顶悬浮窗，实时监测剪切板，遇到想

RJhjjs

663人浏览 · 2021-06-02 17:44:23

RJhjjs · 2021-06-02 17:44:23 发布

一、需求分析

1、音频转文字：目前市面上的音频转文字大多收费。音频转文字的需求是：上传一段音频，直接识别成文字，对于会议记录的比较好使，注意不是实时的语音识别。

2、文字转语音：转的语音不要太生硬。

3、截图文字识别(OCR)：截屏完成即可弹出截图所含图片中的文字。

4、批量图片文字识别：选择多张图片，直接识别出每张图片的文字。

5、复制翻译：看英文文献，有时候懒，如果能有置顶悬浮窗，实时监测剪切板，遇到想要翻译的段落，直接复制，即可给出多国语言翻译结果也是刚需；当然有些论文文本不能复制，所以还复用了截图OCR的功能，对OCR结果进行翻译。

6、图种制作：这个不入流，纯属个人爱好，没啥技术含量。

经测试360杀毒将main.exe误报为病毒，请添加至白名单运行即可。

二、工具展示

需求产生开发动力，基于百度AI和pyqt5制作了自己的小工具，解决了上述所有需求，需求也就是功能了。

1、批量音频转文字

可批量选择要转换的音频即可自动识别，不限时长，免费，识别速度尚可，耐心等待。

(1)比如批量识别小学生课文

(2)比如识别长达五分钟的《荷塘月色》

(3)识别岳云鹏的相声

2、文字转语音

这个没什么好说的，输入文字，选择发音人、语速、音调之类的，可试听，可生产mp3格式的音频文件。

3、截图OCR

点击截图按钮即可截图，自动弹出识别文字。如下动图演示，也是个初版，界面简陋。

4、图片批量识别

在截图OCR下拉按钮有个图片批量文字识别功能，这都属于OCR功能，简单粗暴，批量选择图片，即可识别所有图片中的文字。如下动图演示：

5、复制翻译

看英文文献，有时候懒，如果能有置顶悬浮窗，实时监测剪切板，遇到想要翻译的段落，直接复制，即可给出多国语言翻译结果也是刚需；当然有些论文文本不能复制，所以还复用了截图OCR的功能，对OCR结果进行翻译。如下演示：

6、图种制作

没啥意思，就是将一张图和一个压缩文件合并成一个图片文件，这个生成的图片文件打开是一张图，如果后缀修改为zip，解压后就能看到原先的压缩文件，不做演示了。

三、软件使用

1、下载解压直接运行即可，注意运行弹出的黑窗不能关，目前还没办法去掉，o(╯□╰)o。

2、主界面参数配置，自己动手，输入百度AI的各种接口的key。各种key的获得方法免费，只不过注意免费次数，不过百度免费次数给的肯定够用了。

比如语音识别key获取可参考此文：https://jingyan.baidu.com/article/f3e34a12df0cddf5eb65359f.html

官方地址

CSDN学习社区

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐

嵌入式作业（七）：基于Ardunio的STM32串口通信

嵌入式作业（七）0作业要求1Ardunio 完成STM32的串口通信（1）安装Ardunio IDE（2）stm32串口通信2关于 stduino IDE0作业要求安装 Ardunio IDE 和相关软件支持库，在Ardunio 完成STM32板子的串口通信程序：（1）持续向串口输出“Hello world！”；（2）当接收到“stop!”时，停止输出。网上有一个国人版的MCU集成开发平台， st

CSDN学习社区

JDBC详解

JDBC文章目录JDBC什么是JDBC?JDBC驱动程序:Java使用JDBC访问数据库的步骤:设置classpath:Oracle连接字符串的书写格式:简单的例子:常用数据库的驱动程序及JDBC URL:Oracle数据库:SQL Server数据库MySQL数据库Access数据库PreparedStatement接口:JNDI-数据源（Data Source）与连接池（Connection

CSDN学习社区

“模式识别与机器学习”学习笔记no2.再谈感知机

接**上篇：上篇主要进行了PLA，Pocket算法的理论过程分析和在给定数据集上利用pocket算法对数据集进行分类学习，得到错分数量最少的分类面。上篇中pocket算法的过程已经进行了编程和测试，框架已经建立了起来，这一篇主要上篇中没有提到或涉及不深的几个问题。1.数据集的构造。上篇是直接使用了题目给的向量，这次来根据正态分布来产生数据集。np.random.normal函数可以根据均值和方差生