多语种语音转文字工具buzz(支持ChatGPT的api)
1. buzz是什么?
可以把多语种语音、视频转文字的工具。 个人测试了俄语的语音转文本,质量非常高,是我接触过的质量最高的语音转文本工具。
注意:要使用它,需要先有一个ChatGPT的账号。因为要调用ChatGPT的api。也就是说,这个软件只是一个壳,真正干工作的,还是ChatGPT。
2. 下载
下载地址: https://github.com/chidiwilliams/buzz
① 点击“releases”

② 支持MacBook 和Windows,单击即可下载

3. 安装
软件下载后,双击安装即可
4. 获取ChatGPT的api
打开网址: https://platform.openai.com/account/api-keys
登录后,点击生成新的秘钥(api key)。注意,这个秘钥只显示一次。 复制保存它。
特别注意 秘钥非常重要,不要暴露给任何人。 它就像你保险柜的钥匙。

5.语音转文本
首先准备好一段语音(MP3、MP4均可。但是推荐mp3,体积比较小。因为要把文件上传到他们的服务器上,文件太大,耗费时间)
5.1 双击图标,打开文件

5.2 添加文件

在Model(模式)里,选择 OpenAI whisper API

① 在Access Token里,输入第4步获取的ChatGPT的API秘钥
② 选择目标语言,这里以俄语为例。支持的语言比较多, 它几乎支持我们知道的所有语言。
③ 点击“Run”,开始把语音转为文字

这里的状态是“Queued(排队)”,说明正常。 语音文件正在处理中。
如果是Failed(失败), 说明任务错误,很可能是api设置错误。
如果是Completed(完成),说明语音转文字成功。
特别注意: 使用这款软件时,需要魔术开全局。

5.3 导出文件
当出现“completed(完成)后,点击”双箭头“符号

点击右下角的“export(导出)”, 可以导出为TXT,srt或者vtt格式。

发表评论