一个把语音转成视频的神器工具,根据音频内容,自动适配口型。
根据语音内容自动适配口型,技术上称为:LipSync,顾名思义,就是唇形的自动同步。
目前最新版本牛哥已经集成了目前质量最高的开源模型,同时对推理工作流代码做了调整,使其可以适配各种需求环境
唇形同步部分提供三个参数进行设置:
video-samples
目录下,重启软件,就会看到你自己的素材。点击素材选择框后面的
播放
按钮可以预览素材效果。
还原质量:这个参数决定了最终输出视频时,唇形同步的强度,一般 1.5 ~ 2.0 之间可以得到一个平衡。
迭代步数:又称为推理步数,也就是每合成一次图像需要AI工作多少次,一般这个参数要在20以上效果比较好。
以上,参数调整会对输出的速度和质量产生影响,速度越快,效果越差,反之亦然,各自看自己的实际效果,进行合理设置。
点击 批量打开文件
会弹出系统打开文件对话框,选择需要合成的语言文件(也就是wav音频文件),可以一次性多选。
点击 批量处理
按钮,开始处理,软件会依次对导入的文件进行处理,全部完成后,会弹出对话框提示。
点击 打开输出目录
按钮,会打开程序的输出目录,内部分两个文件夹,与 引擎选择
下拉框内名称一致的文件夹即为对应的输出。
点击 打开日志
按钮,会打开程序的输出日志,当程序未能正确工作,联系牛哥反馈问题时,请附带对应的日志文件。