[分享创造] vibe coding 了一个调用本地 TTS 服务的文字转语音工具

MOSS-TTS-Nano Web 工具:本地部署的轻量级语音合成方案 概述 MOSS-TTS-Nano 来自 MOSI.AI / OpenMOSS 团队,属于 MOSS-TTS 系列里的轻量版本。官方介绍里说它是一个开源多语言小型语音生成模型,参数量大约 0.1B ,也就是 1 亿参数级别,目标就...
[分享创造] vibe coding 了一个调用本地 TTS 服务的文字转语音工具
[分享创造] vibe coding 了一个调用本地 TTS 服务的文字转语音工具

MOSS-TTS-Nano Web 工具:本地部署的轻量级语音合成方案

概述

MOSS-TTS-Nano 来自 MOSI.AI / OpenMOSS 团队,属于 MOSS-TTS 系列里的轻量版本。官方介绍里说它是一个开源多语言小型语音生成模型,参数量大约 0.1B ,也就是 1 亿参数级别,目标就是实时语音生成、CPU 可运行、部署简单,所以我尝试用了自己的小水管服务器部署了下,感觉还不错。

核心特性

  • 本地推理:所有语音合成在本地完成,数据不出网,无第三方 API 调用
  • 29 种预置音色:覆盖中文、英文、日语、韩语、法语、德语等 10+ 语言的多口音音色
  • WAV 无损输出:48kHz 采样率,支持音频元信息解析(时长、声道数、采样率)

使用方式

浏览器打开工具页面:

  1. 输入文本(支持中英文及多语言)
  2. 选择音色
  3. 点击生成,等待合成完成
  4. 在线试听或下载 WAV 文件

点我跳转:文字转语音工具

来源: v2ex查看原文