AI基础设施工程师(推理方向)
4.5-7万元/月
更新 2026-01-09 14:16:40
浏览 651
职位详情
其他技术职位
3-5年
infra 推理
岗位职责:
1.运用算子优化、显存/KVcache管理优化、分布式加速等手段进行推理框架的开发与性能提升;
2.参与大规模模型在高并发场景下的推理性能剖析与调优,识别系统性能瓶颈并设计有效优化策略;
3.研究低资源环境下大模型的轻量化技术路径,包括模型量化、投机采样、稀疏注意力等方法;
4.协同团队成员,推进各项优化技术在实际业务场景中的落地与应用。
岗位要求:
1.计算机、人工智能、软件工程等相关专业硕士及以上学历;
2.掌握大模型推理优化相关技术,具备tensorRT_llm、vllm、sglang等主流开源推理框架开发经验者优先;
3.精通Python/C++编程,有CUDA开发及GPU性能调优实践经验者优先;
4.在顶级会议发表论文、获得竞赛奖项或具备相关实习经历者可获加分。
1.运用算子优化、显存/KVcache管理优化、分布式加速等手段进行推理框架的开发与性能提升;
2.参与大规模模型在高并发场景下的推理性能剖析与调优,识别系统性能瓶颈并设计有效优化策略;
3.研究低资源环境下大模型的轻量化技术路径,包括模型量化、投机采样、稀疏注意力等方法;
4.协同团队成员,推进各项优化技术在实际业务场景中的落地与应用。
岗位要求:
1.计算机、人工智能、软件工程等相关专业硕士及以上学历;
2.掌握大模型推理优化相关技术,具备tensorRT_llm、vllm、sglang等主流开源推理框架开发经验者优先;
3.精通Python/C++编程,有CUDA开发及GPU性能调优实践经验者优先;
4.在顶级会议发表论文、获得竞赛奖项或具备相关实习经历者可获加分。
相似职位
很抱歉,暂无相似职位!