教程与演示视频

【核心功能使用演示】【软件配置及添加模型演示】 挂机1天,批量TXT合成170万字有声书 模型动态切换多情绪风格 (多角色+多情绪) 可对361度、360这种词发音纠正,可逐句逐段落精调


GPT-SoVITS自建TTS配音试听

这是一个基于GPT-SoVITS本地电脑自建的配音效果展示,仅用于个人学习交流,严禁用于其它用途。

名称 文案 配音试听
测试模型(1) 师傅,您看八戒的身价又涨了十块,俺老孙琢磨着拿八戒换手机能一人一台。
测试模型(2) 天呐!小米坡又出新品啦!这次是超牛的配音工具!谁不想用效率高一点的工具呢?操作简单功能丰富!我宣布这就是本月最值得打卡的软件!
测试模型(3) 小助手捕捉到你对免费配音软件话题可能感兴趣,邀请你参与话题发文讨论,小助手将给你本次发文的内容送上专属流量福利!
测试模型(4) 她们当中每一个人都不知道自己本身有多好,她们只想变成别人眼中想让她们变成的样子,实在是很悲哀。
测试模型(5) 注意看![p0.3]这个男人叫小帅,他刚从坏人手里救下心爱的女孩小美,心想。

版本历程

2025版sp12.3 版本 (2025-06-09)

最新版本 For GPT-SoVITS V2/V3
  • 1、新增对GPT-SoVITS V2 Pro版的适配支持
  • 2、批量TXT合成语音功能增加批量字幕功能,可在批量TXT合成语音中获取音频的同时获取字幕srt文件
  • PS:未来API管理器将停止对V3/V4的适配,官网也说了没必要再用v3v4。以下是官方Github说明:从benchmark跑分看,没有必要再用v3v4,因为v2Pro系列和v2硬件需求一样,但是zero shot相似度和v3v4同一水平线

2025版sp12.2 版本 (2025-05-24)

  • 1、修复上个版本中造成音/视频转录异常的BUG。
  • 2、增加模型自动重启功能(我们发现百万字文章批量配音中,会低概率偶发一直卡在某句配音不完成,需重启模型)。

2025版sp12.0 版本 (2025-05-22)

  • 1、修复批量txt部分utf-8文件编码读取乱码的问题。
  • 2、修复特殊字符过滤表对常见单位符号的影响。
  • 3、修复网页配音功能的浏览器阻塞问题(以支持用户通过刷新网页丢弃正在执行的配音重新开始)。
  • 4、网页配音界面增加顶部状态栏,可实时查看正在合成语音的文本。
  • 5、修复较长文本合成语音时,网页配音服务会变成停止状态的问题。
  • 6、优化长文本合成语音功能,实验环境中测试提升约33%(近1万字小说从15分钟变10分钟)。

2025版sp11.0 版本 (2025-04-25)

  • 1、增加了情绪风格库,可为模型添加N种不同情绪参考音频,并在一次配音中随意切换多种情绪风格。
  • 2、自动修复v2-240821版整个包无法使用日语角色模型的问题。
  • 3、修复上个版本添加角色模型无法添加日语、韩语的问题。

2025版sp10.0 版本 (2025-04-11)

  • 1、网页配音增加逐句&逐段模式,方便对文章中不满意的句子&段落局部重配而不需要全文重来
  • 2、优化纠音功能,以支持iphone16e、361度这种文案的发音修正
  • 3、重构批量API管理器软件,更直观简单
  • 4、优化一些细节上的体验以及显存模型自动释放功能
  • 5、增加一键更新功能,未来新版发布时可直接更新无需官方完整重新下载包

2025版sp9 版本 (2025-03-25)

  • 推出支持GPT-SoVITS-v3lora-20250228整合包的ForV3批量API管理器

2025版sp8 版本 (2025-03-22)

  • 1、网页配音新增视频变声转录功能(方便制作课件教程视频的配音优化)
  • 2、API角色列表增加运行记录查看功能(方便查看一些耗时状态的进度)
  • 3、优化音频转录功能与原音频时间对齐
  • 4、优化不同专业版重复弹窗提示的问题
  • 5、增加多开检测,防止多开引发位置问题

2025版sp7 版本 (2025-03-05)

  • 1、新增文本合成语音时,可同时生成音频的字幕文件。(方便用户把音频和字幕同时导入剪映等视频软件)
  • 2、修复配音文案存在空白宽字符会导致配音失败的问题。(方便一些包含表情图标的文案不清理也能合成语音)
  • 3、修复软件非预期启动下,网页配音无法检测到角色在线的问题。
  • 4、其它细节完善。

2025版sp6 版本 (2025-02-07)

  • 1、批量txt合成音频后,增加批量下载音频功能。
  • 2、完善部分情况下的卡在启动中等细节问题。
  • 3、内置一套角色模型仅用于测试。

2025版sp5 版本

  • 1、优化界面与外观,减少不必要步骤。
  • 2、API列表增加分页显示以支持添加更多角色模型。
  • 3、批量txt合成语音时,下载音频文件以txt文件名当音频文件名,方便识别。
  • 4、增加对离线使用的支持,完成软件版本验证后,即可永久离线断网使用。

2025版sp4 版本 (2025-01-16)

  • 1、配音角色模型加了自启动选项,可以实现开机启动或意外停止后自动恢复。
  • 2、优化网页配置的seed随机方式,优化批量txt的seed随机,使每个txt配音效果都能随机(原来是自动固定第一次seed)。
  • 3、批量txt文档合成语音,增加勾选功能,当某几个txt合成效果不满意,你可勾选后再次点击合成语音,不勾选的不影响。

2025版非正式sp3版本 (2025-01-14)

  • 修复批量txt合成语音中,存在的对txt文件编码兼容的问题。

2025版sp2 版本 (2025-01-10)

  • 新增了变声功能(音频文件转录)
  • 完善软件右侧配置的自动保存与记忆
  • 修复上一版本反馈的部分BUG
  • 网页端增加片段间隔静音设置

2025版sp1 版本 (2024-12-29)

  • 重要修复:api合成语音存在不走v2版本的问题,这可能是大家反馈配音与整个包webui差距较大的重要原因之一
  • 汉字多音字纠音使用拼音,不再使用同音汉字,如“角色”可用“jue2,se4”来纠音
  • 优化了电脑端、手机端 网页配音的界面外观
  • 增加批量.txt文件转语音功能

2025版sp0 版本 (2024-12-29)

  • 能够创建本机网页配音(支持音量、语速、多角色、使用停顿)
  • 支持创建带密码加固的局域网网页配音或外网网页配音
  • 局域网和外网网页配音支持设置品牌名称,方便宣传
  • 这个版本在创建API时,除了主参考音频,还可叠加附加参考音频,优化配音的效果

联系我们

邮箱:xmpsoftpro#gmail.com ,微信联系请右侧扫码,加微信请注明来意。

由于骚扰太多,现只为付费用户提供技术支持,添加请备注是否付费过。

微信二维码