关于TTS的相关问题,请先查阅此文档,或许就能解决你的问题哦。
如果这里面没有涵盖,请私信牛哥,牛哥会后续更新。
为什么数字不能被正确发声?
在TTS引擎里,文本中的 123 这样的字符不能被正确识别发声为“一百二十三”,也不会发出“一二三”,不同的引擎表现会有所不同。
为了解决这个问题,有两种方案:
我如何复刻自己的声音?
复刻声音是TTS最基本的需求,操作方法为:
tts-samples
目录,注意文件名后续会显示在程序,所以请合理命名。xiaohong.mp3
,那么就创建一个 xiaohong.mp3.txt
的文件,将mp3语音内容对应文本添加到这个txt文件后保存。为什么有些音色文件不能正常工作,有些可以?
一般出现部分音色不能正常工作时,主要原因可能是在参考文本上,请注意:
繁体中文电脑TTS无输出文件问题怎么解决?
非简体中文的电脑,在使用TTS的时候,如果参考音频路径,或者文本路径中存在非英文字符,就会导致转换完成,但提示文件不存在问题。
如果查看日志会发现最后几行内容类似以下情况:
[2025-05-17 22:32:19]-Traceback (most recent call last):
[2025-05-17 22:32:19]- File "C:\AutoRobot-Release\Niugee-Robot-V1.6.1-FullPackage\_internal\nn-f5tts\nn_app.py", line 34, in <module>
[2025-05-17 22:32:19]- _internal_main()
[2025-05-17 22:32:19]- File "nn.py", line 245, in nn._internal_main
[2025-05-17 22:32:19]- File "nn.py", line 154, in nn.nn_infer
[2025-05-17 22:32:19]- File "nn.py", line 41, in nn.p
[2025-05-17 22:32:19]- File "nn.py", line 32, in nn.pp
[2025-05-17 22:32:19]- File "C:\AutoRobot-Release\Niugee-Robot-V1.6.1-FullPackage\_internal\nn-f5tts\f5-tts\lib\site-packages\wandb\sdk\lib\console_capture.py", line 147, in write_with_callbacks
[2025-05-17 22:32:19]- n = orig_write(s)
[2025-05-17 22:32:19]-UnicodeEncodeError: 'cp950' codec can't encode character '\u5b66' in position 106: illegal multibyte sequence
[2025-05-17 22:32:21]-
[2025-05-17 22:32:21] >>>>> C:\AutoRobot-Release\Niugee-Robot-V1.6.1-FullPackage\_internal\nn-f5tts>echo
解决方法:直接把参考音频,输入文本以及程序的路径修改为纯英文且无空格的路径,即可正常工作。