如果你在处理视频的语音,那这工具刚好合适。Voice-Pro是个免费的AI工具,集成了多个功能的AI音频工具,例如语音转录、翻译、语音合成等,还支持视频处理与批量操作。对标ElevenLabs(有顶尖的AI合成技术)。在部署之前,来个对比。
【部署教程】
0、先看看部署成功后是长什么样。
1、设备要求
GPU显存要求至少8G,这次使用3060显卡,是足够了。其他配置一般的电脑都是能满足。磁盘空间留大一点,部署完成之后大概有35G。
2、开始安装
第一步是先git程序下来。
第二步是进voice-pro目录,执行configure.bat。如果有报错,开科学上网再跑一遍。
第三步是执行start.bat,前面的图都忘记截了,start这个截了。最后有个模型没有下载下来,还是网络的问题。
这个成功之后,会自动启动浏览器,并打开网页。
第四步功能测试,在这里,体验了下视频的字幕翻译、语音翻译,都挺好使。测试下来发现,油管的视频处理功能是废了,这个可能是油管的策略升级了,不能下载。对于所有视频平台的视频下载中,油管是最严格的。
F5-TTS的语音合成
集成了蔡依林、迪丽热巴、李易峰、吴某凡、杨幂、赵丽颖的声音,可以直接用。
生成的速度还是可以的,这个工具中有些功能我没用到,所以就没去试了。可惜这个工具可能不会再有更新了,作者忙别的项目去了,且用且珍惜。






