[酷工作] ai infra sre 内推~

对 ai infra 领域感兴趣的同学欢迎投递~ 深入理解 vLLM/SGLang 等主流引擎机制,优化推理服务稳定性与资源效率~ 期望构建基于可观测体系( Metrics/Profiling/Tracing )的性能回归自动化平台。设计高可用架构,建立故障应急、容量评估与限流降级机制,分析线上异常...
[酷工作] ai infra sre 内推~
[酷工作] ai infra sre 内推~

对 ai infra 领域感兴趣的同学欢迎投递~ 深入理解 vLLM/SGLang 等主流引擎机制,优化推理服务稳定性与资源效率~ 期望构建基于可观测体系( Metrics/Profiling/Tracing )的性能回归自动化平台。设计高可用架构,建立故障应急、容量评估与限流降级机制,分析线上异常( OOM 、延迟抖动、软死锁等)并闭环解决~ https://neitui.italent.cn/AIPOWER/sharejobs/detail?shareId=1ebaacf1-b42f-4929-8185-de95c2c1ea85&language=zh_CN

来源: v2ex查看原文