
🎙️ MaxSpeak — AI 语音合成工作台
免费 · 开源 · 300+ 音色 · 音色复刻 · 音色设计
🔗 在线体验: https://maxspeak.vercel.app 📦 GitHub: https://github.com/harlan-zhang/maxspeak
[推广] 火山云 coding plan 活动推广, 9.9 元 lite 套餐,50 元 pro 套餐
[华为] 做了 iOS / Android / 鸿蒙三端,说下鸿蒙端的真实开发体验
这是什么?
一个基于 MiniMax 语音大模型的全栈 TTS 工具,浏览器打开即用。
能做什么?
- AI 语音合成 — 文本转语音,9 种情感风格(开心/悲伤/愤怒/耳语…)、语速/音高精细调控、22 种副语言标签(叹气/笑声/呼吸…)
- 音色复刻 — 上传 10 秒音频即可克隆任意音色,适合播客、有声书、无障碍场景
- 音色设计 — 用自然语言描述想要的音色,AI 即时生成("温暖亲切的女声,适合读睡前故事")
- 流式播放 — SSE 流式输出实现边生成边播放,长文本自动切换流式
- 300+ 预置音色 — 中英日韩粤 + 西葡法德俄等 20+ 语言
技术栈
Next.js 14 + TypeScript + Tailwind CSS + Zustand + Web Audio API
为什么开源?
MiniMax 的 API 能力很强但缺少一个好用的前端。这个工具把复杂的 API 参数(情感控制、副语言标签、音色修饰、发音词典…)全部做成了可视化界面,降低使用门槛。
关于 API Key
应用本身不要钱,语音合成走 MiniMax API 按量计费(约 ¥2-3.5/万字符)。API Key 只存浏览器本地,不经过任何第三方服务器。
部署
欢迎试用,有任何建议或 bug 直接提 Issue 🙏