如果你在处理视频的语音,那这工具刚好合适。Voice-Pro是个免费的AI工具,集成了多个功能的AI音频工具,例如语音转录、翻译、语音合成等,还支持视频处理与批量操作。对标ElevenLabs(有顶尖的AI合成技术)。在部署之前,来个对比。

图片

【部署教程】

0、先看看部署成功后是长什么样。

图片

1、设备要求

GPU显存要求至少8G,这次使用3060显卡,是足够了。其他配置一般的电脑都是能满足。磁盘空间留大一点,部署完成之后大概有35G。

图片

2、开始安装

第一步是先git程序下来。

图片

第二步是进voice-pro目录,执行configure.bat。如果有报错,开科学上网再跑一遍。

图片

第三步是执行start.bat,前面的图都忘记截了,start这个截了。最后有个模型没有下载下来,还是网络的问题。

图片

这个成功之后,会自动启动浏览器,并打开网页。

图片

第四步功能测试,在这里,体验了下视频的字幕翻译、语音翻译,都挺好使。测试下来发现,油管的视频处理功能是废了,这个可能是油管的策略升级了,不能下载。对于所有视频平台的视频下载中,油管是最严格的。

F5-TTS的语音合成

集成了蔡依林、迪丽热巴、李易峰、吴某凡、杨幂、赵丽颖的声音,可以直接用。

图片

生成的速度还是可以的,这个工具中有些功能我没用到,所以就没去试了。可惜这个工具可能不会再有更新了,作者忙别的项目去了,且用且珍惜。



发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Search

About

Lorem Ipsum has been the industrys standard dummy text ever since the 1500s, when an unknown prmontserrat took a galley of type and scrambled it to make a type specimen book.

Lorem Ipsum has been the industrys standard dummy text ever since the 1500s, when an unknown prmontserrat took a galley of type and scrambled it to make a type specimen book. It has survived not only five centuries, but also the leap into electronic typesetting, remaining essentially unchanged.

Tags

Gallery