工具介绍
一种工具,旨在将文本、PDF、EPUB 和 SRT 文件转换为多种语言的语音音频,包括语音克隆、LLM 基于文本的预处理以及通过将同步输出与视频的原始音轨混合来直接将生成的字幕音频保存到视频文件的能力。
它利用 XTTS、Silero 和 VoiceCraft 模型进行文本到语音转换和语音克隆,并通过 RVC_CLI 进行增强,以提高质量和更好的语音克隆结果,并通过 NISQA 进行音频质量评估。
此外,它还集成了 Text Generation Webui 的 API,用于基于本地LLM的文本预处理,从而在音频生成之前实现广泛的文本操作。
工具地址
GitHub:https://github.com/lukaszliniewicz/Pandrator
【Applnn】温馨提醒:
1.本站发布的文章及附件仅限用于学习和研究,不得用于商业或非法用途,否则后果请用户自负!
2.本站信息来自网络收集整理,版权争议与本站无关,仅供学习研究,如有侵权请联系客服删除!
3.如果您喜欢该程序和内容,请支持正版,购买注册,得到更好的正版服务。
4.如果您喜欢我们,多多分享给你们朋友吧!