多语种语音转文字工具buzz(支持ChatGPT的api)
1. buzz是什么?
可以把多语种语音、视频转文字的工具。 个人测试了俄语的语音转文本,质量非常高,是我接触过的质量最高的语音转文本工具。
注意:要使用它,需要先有一个ChatGPT的账号。因为要调用ChatGPT的api。也就是说,这个软件只是一个壳,真正干工作的,还是ChatGPT。
2. 下载
下载地址: https://github.com/chidiwilliams/buzz
① 点击“releases”
![](https://mdnice007.oss-cn-beijing.aliyuncs.com/obsidian/202303311743522.png)
② 支持MacBook 和Windows,单击即可下载
![](https://mdnice007.oss-cn-beijing.aliyuncs.com/obsidian/202303311745207.png)
3. 安装
软件下载后,双击安装即可
4. 获取ChatGPT的api
打开网址: https://platform.openai.com/account/api-keys
登录后,点击生成新的秘钥(api key)。注意,这个秘钥只显示一次。 复制保存它。
特别注意 秘钥非常重要,不要暴露给任何人。 它就像你保险柜的钥匙。
![](https://mdnice007.oss-cn-beijing.aliyuncs.com/obsidian/202303261916309.png)
5.语音转文本
首先准备好一段语音(MP3、MP4均可。但是推荐mp3,体积比较小。因为要把文件上传到他们的服务器上,文件太大,耗费时间)
5.1 双击图标,打开文件
![](https://mdnice007.oss-cn-beijing.aliyuncs.com/obsidian/202304010957186.png)
5.2 添加文件
![](https://mdnice007.oss-cn-beijing.aliyuncs.com/obsidian/202304010959465.png)
在Model(模式)里,选择 OpenAI whisper API
![](https://mdnice007.oss-cn-beijing.aliyuncs.com/obsidian/202304011000381.png)
① 在Access Token里,输入第4步获取的ChatGPT的API秘钥
② 选择目标语言,这里以俄语为例。支持的语言比较多, 它几乎支持我们知道的所有语言。
③ 点击“Run”,开始把语音转为文字
![](https://mdnice007.oss-cn-beijing.aliyuncs.com/obsidian/202304011002672.png)
这里的状态是“Queued(排队)”,说明正常。 语音文件正在处理中。
如果是Failed(失败), 说明任务错误,很可能是api设置错误。
如果是Completed(完成),说明语音转文字成功。
特别注意: 使用这款软件时,需要魔术开全局。
![](https://mdnice007.oss-cn-beijing.aliyuncs.com/obsidian/202304011005198.png)
5.3 导出文件
当出现“completed(完成)后,点击”双箭头“符号
![](https://mdnice007.oss-cn-beijing.aliyuncs.com/obsidian/202304011020953.png)
点击右下角的“export(导出)”, 可以导出为TXT,srt或者vtt格式。
![](https://mdnice007.oss-cn-beijing.aliyuncs.com/obsidian/202304011023433.png)
发表评论