indesign软件一直闪退怎么办_音频转文字这种刚需,我用python写了个软件,免费不限时...
最新独立版本,bug更少,支持格式更多,欢迎体验。王华:音频转文字工具,完全免费,自己用Python写的!zhuanlan.zhihu.com一、需求分析:1、音频转文字:目前市面上的音频转文字大多收费。音频转文字的需求是:上传一段音频,直接识别成文字,对于会议记录的比较好使,注意不是实时的语音识别。2、文字转语音:转的语音不要太生硬。3、截图文字识别(OCR):截屏完成即可弹出截图所含图片..
![0a7598a9920ee442fa88d15284af21a6.png](https://img-blog.csdnimg.cn/img_convert/0a7598a9920ee442fa88d15284af21a6.png)
最新独立版本,bug更少,支持格式更多,欢迎体验。
王华:音频转文字工具,完全免费,自己用Python写的!zhuanlan.zhihu.com![8e9c377a411cb31eaa0f83f0357f13ef.png](https://img-blog.csdnimg.cn/img_convert/8e9c377a411cb31eaa0f83f0357f13ef.png)
一、需求分析:
1、音频转文字:目前市面上的音频转文字大多收费。音频转文字的需求是:上传一段音频,直接识别成文字,对于会议记录的比较好使,注意不是实时的语音识别。
2、文字转语音:转的语音不要太生硬。
3、截图文字识别(OCR):截屏完成即可弹出截图所含图片中的文字。
4、批量图片文字识别:选择多张图片,直接识别出每张图片的文字。
5、复制翻译:看英文文献,有时候懒,如果能有置顶悬浮窗,实时监测剪切板,遇到想要翻译的段落,直接复制,即可给出多国语言翻译结果也是刚需;当然有些论文文本不能复制,所以还复用了截图OCR的功能,对OCR结果进行翻译。
6、图种制作:这个不入流,纯属个人爱好,没啥技术含量。
二、工具展示
需求产生开发动力,基于百度AI和pyqt5制作了自己的小工具,解决了上述所有需求,需求也就就是功能了。
1、批量音频转文字
可批量选择要转换的音频即可自动识别,不限时长,免费,识别速度尚可,耐心等待。
(1)比如批量识别小学生课文
![cd0d73bc2ff0792d8ac733aaea1e1334.png](https://img-blog.csdnimg.cn/img_convert/cd0d73bc2ff0792d8ac733aaea1e1334.png)
(2)比如识别长达五分钟的《荷塘月色》
![1af6af8d4323ba4551d5b47571f84878.png](https://img-blog.csdnimg.cn/img_convert/1af6af8d4323ba4551d5b47571f84878.png)
(3)识别岳云鹏的相声
![0afaf2e2cb27b050ea6480621220ba9f.png](https://img-blog.csdnimg.cn/img_convert/0afaf2e2cb27b050ea6480621220ba9f.png)
2、文字转语音
这个没什么好说的,输入文字,选择发音人、语速、音调之类的,可试听,可生产mp3格式的音频文件。
![e7f0dec72e7ada1aa86bdc3c198808e4.png](https://img-blog.csdnimg.cn/img_convert/e7f0dec72e7ada1aa86bdc3c198808e4.png)
3、截图OCR
点击截图按钮即可截图,自动弹出识别文字。如下动图演示,也是个初版,界面简陋。
![a17bd61c979befc995d0fdd12503fa04.gif](https://img-blog.csdnimg.cn/img_convert/a17bd61c979befc995d0fdd12503fa04.gif)
4、图片批量识别
在截图OCR下拉按钮有个图片批量文字识别功能,这都属于OCR功能,简单粗暴,批量选择图片,即可识别所有图片中的文字。如下动图演示:
![cebed29decd2d24b6bbded50b19c8345.gif](https://img-blog.csdnimg.cn/img_convert/cebed29decd2d24b6bbded50b19c8345.gif)
5、复制翻译:
看英文文献,有时候懒,如果能有置顶悬浮窗,实时监测剪切板,遇到想要翻译的段落,直接复制,即可给出多国语言翻译结果也是刚需;当然有些论文文本不能复制,所以还复用了截图OCR的功能,对OCR结果进行翻译。
如下演示:
![2d248007157df0313c8489e35359fbb2.gif](https://img-blog.csdnimg.cn/img_convert/2d248007157df0313c8489e35359fbb2.gif)
6、图种制作
没啥意思,就是将一张图和一个压缩文件合并成一个图片文件,这个生成的图片文件打开是一张图,如果后缀修改为zip,解压后就能看到原先的压缩文件,不做演示了。
![9c7efdfda2671dab6664b665b78b94de.png](https://img-blog.csdnimg.cn/img_convert/9c7efdfda2671dab6664b665b78b94de.png)
三、软件使用
1、下载解压直接运行即可,注意运行弹出的黑窗不能关,目前还没办法去掉,o(╯□╰)o。
下载链接:https://pan.baidu.com/s/1EiML_eBduE71PDxYmexgfQ
提取码:hbjv
2、主界面参数配置,自己动手,输入百度AI的各种接口的key。
各种key的获得方法免费,只不过注意免费次数,不过百度免费次数给的肯定够用了。
比如语音识别key获取可参考此文:https://jingyan.baidu.com/article/f3e34a12df0cddf5eb65359f.html
然后给出官方地址
语音转文字:语音识别极速版,60秒内语音快速准确识别成文字-百度AI开放平台
截图文字识别:百度文字识别,覆盖全面,响应迅速,准确率超99%-百度AI开放平台
文字转语音:语音合成-百度AI开放平台
复制翻译:百度翻译开放平台
注意申请完,在key界面如下点击领取哈,否则会出现转换空文件夹的情况
注意申请完,在key界面如下点击领取哈,否则会出现转换空文件夹的情况
注意申请完,在key界面如下点击领取哈,否则会出现转换空文件夹的情况
写这么多次,还能有人看不见嘛????
![3fe18d7b555b95c45bf68f6e9b1d48ce.png](https://img-blog.csdnimg.cn/img_convert/3fe18d7b555b95c45bf68f6e9b1d48ce.png)
![b76a133d2385e8fa2407901b338806b3.png](https://img-blog.csdnimg.cn/img_convert/b76a133d2385e8fa2407901b338806b3.png)
四、注意事项:
软件做的仓促,界面简陋,且各种未知bug再所难免,如有建议可查看关于软件,有交流QQ群。
下载链接
https://pan.baidu.com/s/1EiML_eBduE71PDxYmexgfQ
提取码:hbjv
注意申请完,在key界面如下点击领取哈,否则会出现转换空文件夹的情况
防止看不见!!!!
![3fe18d7b555b95c45bf68f6e9b1d48ce.png](https://img-blog.csdnimg.cn/img_convert/3fe18d7b555b95c45bf68f6e9b1d48ce.png)
更多推荐
所有评论(0)