软件基于 百度云
夸克网盘
Google Drive
三个渠道进行分发,下载地址为:
百度云:
链接: https://pan.baidu.com/s/18zWQyjgyckgDciDtFzCytg?pwd=j8ef 提取码: j8ef
夸克网盘:
链接:https://pan.quark.cn/s/c371cc064c2b 提取码:B4hi
Google Drive:
https://drive.google.com/drive/folders/1-AbrPv09a7YRTYM4Od_Byvc8UqqQj0J1?usp=sharing
获取授权:
本分享是对支持牛哥牛哥福利:
https://afdian.com/item/f999aa9ee30d11ef935b52540025c377
AutoRobot Studio 不定期会发布新版本,请保持关注。
以下为更新日志:
1.5.2 基于最新引擎的相对稳定版本,主要修复1.5.x各版本反馈的问题
Release Date: 2025-04-20
- [ADD] 添加对最新的 50 系列显卡的支持
1.5.2 主要修复部分torch版本兼容性问题引起的TTS工作失败的问题
Release Date: 2025-04-14
- [UPDATE] 修复 1.5.1 TTS部分因Torch运行库版本不适配,导致的失败问题
1.5.1 主要修复部分本地CUDA版本较低,引起TTS工作失败的问题
Release Date: 2025-04-13
- [UPDATE] 修复 1.5.0 TTS部分因CUDA运行库版本不适配,导致的失败问题
1.5.0 版本对音频(TTS)和视频(LipSync)两个引起均做了大更新,目前的效果是牛哥满意的
同时,对UI做了一次升级,提供更多控制能力和便捷能力
Release Date: 2025-04-12
- [UPDATE] 更新了视频部分的模型,质量上达到专业级别
- [UPDATE] 合并了10S模式(乒乓算法)和长视频模式为统一的[智能模式]:
1. 视频素材时长无要求,会自动按乒乓算法往复使用,即:正向播放到结尾后,继续倒放到开头,以此循环,提供无穷无尽的视频素材长度。
2. 输出时长以音频为准,视频部分按上文[1]自动补齐。- [ADD] 添加了新的资源使用逻辑,无论输出的视频长短,保持一个低内存,低显存的占用状态,不会爆显存及内存
- [ADD] TTS引擎添加了自动的参考音频文案识别,防止手动处理文案不正确导致的输出有幻觉问题
- [ADD] TTS引擎添加了推理步数,淡化时间等相关控制参数,让输出更可控
- [ADD] LipSync引擎添加了[还原质量]和[推理步数]两个选项,让使用时可以自行掌握速度和质量的一个平衡
- [ADD] 添加了播放预览按钮,可以对选定的素材,直接快速预览
- [UPDATE]其他一些大家反馈的零星问题,记不请了
1.4.0 版本主要对长视频引擎做了相关调整:大家多试试长视频版本,这个版本感觉效果好很多
Release Date: 2025-03-06
- [UPDATE]更新了长视频输出的质量
- [UPDATE] 解决了视频时长不够导致输出视频后面卡主的问题
- [ADD] 添加了对视频时长和音频时长的判断,输出以短的时间为准
- [ADD] 添加了定制软件名的多语言支持
- [UPDATE]其他一些大家反馈的零星问题,记不请了(TTS问题还没怎么处理,所以音频没变化)
1.3.0 版本主要对视频引擎做了相关调整:
Release Date: 2025-02-17
- [ADD] 新增了无限时长模式的视频生成:NN-LatentSync(长视频V1),这个模式下,源素材不会再循环重复,所以请准备足够长度的源视频素材,否则低于音频时长,会导致失败。
- [UPDATE] 更新了10秒乒乓模式的缓存逻辑,让缓存更节省空间。
- [DELETE] 删除了大家不太使用的VideoRetalking模式,速度不快,效果也不好。
目前NN-LatentSync(长视频V1)模式属于首次发布,缓存模式还未添加,后续还有优化空间:
1.0.2 版本是一次年度大更新,春节档不打烊,哪吒可以闹海,牛哥重磅更新:
Release Date: 2025-02-05
- [ADD] 语音引擎更新了流水线,优化了代码,目前基本所有反馈问题已处理完毕,也无需再首次初始化操作。
- [ADD] 视频引擎全新重构了流水线,目前可以无极限输出,大幅降低资源占用率,采用乒乓算法,可以随意视频素材长度,按音频长度输出。
- [ADD] 支持软件名称定制等能力
1002 新增了一个超快的视频引擎(已设置为默认),同时支持缓存参考视频能力,一个参考视频被处理过后,后续会直接使用缓存。
硬件要求
Release Date:2025-01-12
- [Add] 添加了一个新的视频处理引擎,效果好,速度还很快,如果你的速度慢,可能你显卡驱动太旧或者显卡性能太低
- [Add] 添加了版本定制能力,可以自定义软件名和帮助官网
- [Update] 更新了任务结束时的提示及输出文件检查,任务完成情况一目了然
- [Update] CUDA更新到12.6
V1001版本相比上一个版本主要修改均集中在主程序的工作流部分,以易用性为导向,如果以使用V1000版本,可以直接只下载V1001升级包,解包后,将解压后的几个文件复制到原V1000程序位置,打开新文件即可。
Release Date:2024-12-22
- [Add]登录界面添加记住用户名和密码功能,以方便重复登录。
- [Add]添加 代理服务器设置 能力,以解决部分情况下需要代理才能登录的问题。
- [Add]添加点击打开源按钮,自动记录上次打开路径,方便下次快速打开。
- [Misc]添加了用户名和密码复制时首尾带有空格,导致的登录失败问题。
- [Fix]修复登录窗口,直接回车,退出软件的问题。
Release Date:2024-12-15
- 发布第一个版本
- 集成F5TTS音频引擎
- 集成VideoRetalking工作流版本为语音到视频引擎
- 集成云端身份控制能力
- 集成 ……