语音 Post-Training 算法工程师
Voice Post-Training Algorithm Engineer 全职 · 迪拜 / 远程 · Voice Post-Training · 全球招募
Kapibala AI · WE ARE HIRING · 2026 AI Native 公司 · Token 无限管够
关于我们
Kapibala AI Limited 正组建全球化 AI 团队,聚焦 Sales AGI——覆盖获客、触达、谈判、成交、交付全链路的商业智能体,运行于主流 IM 平台。产品已进入付费内测,被头部加密交易所、Web3 / RWA 、跨境广告等客户采用,在手签约亿级 RMB ;Pre-Seed 轮 1000 万美元已完成,海外独立数据渠道构成核心护城河。
岗位定位
Sales AGI 语音能力的核心建设者。产品需要在真实销售对话中达到 vendor API 给不了的拟人水准——这是护城河的关键一环。你通过后训练 决定怎么建模、敲定训练方法、建立评测体系,把三段式语音对话模型( STT + LLM + TTS )打磨到超越商用方案的拟人度。
岗位职责
- Voice cloning pipeline 端到端搭建
评估并选型主流方案,输出可上线的模型与接口 - STT 和 TTS 针对性优化
针对销售对话场景做 fine-tuning 与指标平衡 - LLM 后训练与场景对齐
基于真实反馈做对齐训练,输出多场景 checkpoint - 拟人度评测体系建设
设计评测方法,闭环驱动训练迭代 - 训练产物的生产部署
与系统侧协同上线,建立灰度与回滚机制
任职要求
- 计算机 / 电子工程 / 语音 / 信号处理 相关专业硕士及以上
- 语音或大模型后训练实战:SFT / DPO / RLHF / LoRA 至少 2 类,有 production 上线
- 熟悉 Whisper / Conformer / VITS / FastSpeech / XTTS / StyleTTS 任一架构
- PyTorch + Hugging Face Transformers / TRL / Diffusers
- DeepSpeed / FSDP / Accelerate ,能独立跑 8 卡及以上训练
- 可读英文论文,跟踪 INTERSPEECH / ICASSP / ACL 并 3-5 天内复现
- 完整语音数据工程:清洗 / 强制对齐 / VAD / 标注规范设计
加分项
- 多语言语音经验(越南语 / 巴西葡萄牙语 / 日语 等小语种优先)
- HuggingFace · ESPnet · Coqui-TTS · WhisperX · F5-TTS 等 contributor / maintainer
- INTERSPEECH · ICASSP · ACL 一作或共一论文
- 熟悉 vLLM · SGLang · TensorRT-LLM 推理优化
我们提供
- ¥ 50-80W · ANNUAL CASH — 极具市场竞争力 · 税后全额到手
- PREMIUM · RESIDENCE — 公司提供高端住宿 · 免去租房琐事
- WORK VISA · RELOCATION — 本人 + 家属 · 律师 + HR 协助
- ∞ TOKENS · AI BUDGET — Claude / GPT / 内部模型不设上限
- TOP PHD · EDUCATION — 顶尖院校全额奖学金 PhD 通道
- PRE-SEED · ESOP — Pre-Seed 期权池 · 与公司共同成长
招聘流程
投递 → HR 初筛 → 技术一面 → CTO 终面 → 试用期 offer (2 周 - 1 月) → base 海外 (居家办公 3-6 月) → 转远程
投递方式
- 邮箱:info@kapibala.ai
- 邮件主题:「应聘岗位名称 - 姓名」
- 微信:bzy-151
- 官网: https://kapibala.ai