整合包-AI学用

Windows下ChatTTS的本地部署

ChatTTS 是一个开源自然语言处理项目，可以生成自然流畅的语音输出。其训练数据涵盖了大量中英文语料库，包括丰富的对话场景和语境信息，使模型能够生成逼真、自然的语音。更重要的是，chattts 支持对笑声、停顿和插入词等声音元素的控制，使得生成的语音更加生动真实。开源以来，持续火爆。毫无疑问，ChatTTS 是目前最好的文本转语音项目，但对新手而言，由于其版本和 API 的迭代，本地化部署一直存在不低的门槛。本文主要讲解在 windows 11 虚拟环境下本地化部署 ChatTTS 的方法和过程，以 conda 为主。由于 python venv 环境无法在 windows 下顺利编译 pynini，也无法在 venv 环境下通过 conda forge 安装预编译的 pynini 包，适合不需要归一化处理的应用。 Git 拉取项目、下载模型甚至安装 python 包，都离不开稳定的网络环境，有需要的可注册订阅「LH机场」。如果需要一个干净的整合包，可以采用本文随附的整合包，仅包含必须依赖、模型和一个示例 example.py文件，下载可通过关注公众号『智能生活引擎』后，发送关键词『ChatTTS』获取直链下载链接。前备条件 ChatTTS 本地部署原生为 linux 平台，且迭代较快，很多时候，小伙伴会发现项目主页的示例脚本不做修改无法运行。本文列举的部署方法和过程，在满足以下前备条件的前提下，是肯定可以成功的。克隆代码仓库创建并激活虚拟环境在 ChatTTS 目录下创建 venv 目录，并指定以此目录创建 conda 虚拟环境。激活该环境后，后续所有命令在此环境下执行。删除通过指定目录创建的虚拟环境应使用以下命令。安装依赖需要注意的是 pynini 务必选择 2.1.5 预编译版本，nemo_text_processing 和 WeTextProcessing 依赖于 2.1.5 版本，而非最新的 2.1.6 版本。如需使用 GPU 加速，在「pytorch 官网」，获取正确的安装命令，pip3 可替换为 pip、torchvision 可剔除，并注意示例的 cuda 版本为 11.8，如不同务必自行替换。需要使用 jupyter notebook 运行的，还需安装 jupyter。 VENV虚拟环境部署ChatTTS 同样，通过 python 自带的 venv，我们也可以创建虚拟环境、本地部署 chattts并制作整合包，依赖的安装都是在虚拟环境下进行的。ffmpeg 等后端音视频处理工具自行安装并配置好环境变量，否则运行会报错。之后，我们可以在 ChatSTS 目录（注意不是 ChatTTS 子目录）下创建 python 脚本文件example.py。激活虚拟环境后运行 example.py 脚本，首次运行会自动从 hugging face 下载模型。 example.py 仅仅提供了一个针对当前版本 ChatTTS 可用的示例，在此基础上可以向 ChatGPT 提问，逐步构建完成你期望的应用。包含所有模型的最小整合包，可通过关注公众号『智能生活引擎』后，发送关键词『ChatTTS』获取直链下载链接。

赞(0)

webmaster2024-07-08工具阅读(887)去评论

标签：整合包

Windows下ChatTTS的本地部署

热门文章

更好地应用AI

共同记录与分享优秀的合规AI平台、AI应用实践、工具以及AI领域最新动态，无论是熊孩子的教育还是一些工作、生活中的任务，都可以让AI这一强大的“副驾驶”帮助我们更接近一个个小目标

切换注册登录

切换登录注册