[酷工作] 语音 Post-Training 算法工程师

语音 Post-Training 算法工程师 Voice Post-Training Algorithm Engineer 全职 · 迪拜 / 远程 · Voice Post-Training · 全球招募 Kapibala AI · WE ARE HIRING · 2026 AI Native 公...
[酷工作] 语音 Post-Training 算法工程师
[酷工作] 语音 Post-Training 算法工程师

语音 Post-Training 算法工程师

Voice Post-Training Algorithm Engineer 全职 · 迪拜 / 远程 · Voice Post-Training · 全球招募

Kapibala AI · WE ARE HIRING · 2026 AI Native 公司 · Token 无限管够


关于我们

Kapibala AI Limited 正组建全球化 AI 团队,聚焦 Sales AGI——覆盖获客、触达、谈判、成交、交付全链路的商业智能体,运行于主流 IM 平台。产品已进入付费内测,被头部加密交易所、Web3 / RWA 、跨境广告等客户采用,在手签约亿级 RMB ;Pre-Seed 轮 1000 万美元已完成,海外独立数据渠道构成核心护城河。

岗位定位

Sales AGI 语音能力的核心建设者。产品需要在真实销售对话中达到 vendor API 给不了的拟人水准——这是护城河的关键一环。你通过后训练 决定怎么建模、敲定训练方法、建立评测体系,把三段式语音对话模型( STT + LLM + TTS )打磨到超越商用方案的拟人度。

岗位职责

  • Voice cloning pipeline 端到端搭建
    评估并选型主流方案,输出可上线的模型与接口
  • STT 和 TTS 针对性优化
    针对销售对话场景做 fine-tuning 与指标平衡
  • LLM 后训练与场景对齐
    基于真实反馈做对齐训练,输出多场景 checkpoint
  • 拟人度评测体系建设
    设计评测方法,闭环驱动训练迭代
  • 训练产物的生产部署
    与系统侧协同上线,建立灰度与回滚机制

任职要求

  • 计算机 / 电子工程 / 语音 / 信号处理 相关专业硕士及以上
  • 语音或大模型后训练实战:SFT / DPO / RLHF / LoRA 至少 2 类,有 production 上线
  • 熟悉 Whisper / Conformer / VITS / FastSpeech / XTTS / StyleTTS 任一架构
  • PyTorch + Hugging Face Transformers / TRL / Diffusers
  • DeepSpeed / FSDP / Accelerate ,能独立跑 8 卡及以上训练
  • 可读英文论文,跟踪 INTERSPEECH / ICASSP / ACL 并 3-5 天内复现
  • 完整语音数据工程:清洗 / 强制对齐 / VAD / 标注规范设计

加分项

  • 多语言语音经验(越南语 / 巴西葡萄牙语 / 日语 等小语种优先)
  • HuggingFace · ESPnet · Coqui-TTS · WhisperX · F5-TTS 等 contributor / maintainer
  • INTERSPEECH · ICASSP · ACL 一作或共一论文
  • 熟悉 vLLM · SGLang · TensorRT-LLM 推理优化

我们提供

  • ¥ 50-80W · ANNUAL CASH — 极具市场竞争力 · 税后全额到手
  • PREMIUM · RESIDENCE — 公司提供高端住宿 · 免去租房琐事
  • WORK VISA · RELOCATION — 本人 + 家属 · 律师 + HR 协助
  • ∞ TOKENS · AI BUDGET — Claude / GPT / 内部模型不设上限
  • TOP PHD · EDUCATION — 顶尖院校全额奖学金 PhD 通道
  • PRE-SEED · ESOP — Pre-Seed 期权池 · 与公司共同成长

招聘流程

投递 → HR 初筛 → 技术一面 → CTO 终面 → 试用期 offer (2 周 - 1 月) → base 海外 (居家办公 3-6 月) → 转远程


投递方式

  • 邮箱:info@kapibala.ai
  • 邮件主题:「应聘岗位名称 - 姓名」
  • 微信:bzy-151
  • 官网: https://kapibala.ai
来源: v2ex查看原文