返回 职位详情 登录/注册
AI基础设施工程师(推理方向)
4.5-7万元/月
定位 北京海淀区度小满金融总部西北旺东路10号院西
更新 2026-01-09 14:16:40 浏览 651
职位详情
其他技术职位 3-5年 infra 推理
岗位职责:
1.运用算子优化、显存/KVcache管理优化、分布式加速等手段进行推理框架的开发与性能提升;
2.参与大规模模型在高并发场景下的推理性能剖析与调优,识别系统性能瓶颈并设计有效优化策略;
3.研究低资源环境下大模型的轻量化技术路径,包括模型量化、投机采样、稀疏注意力等方法;
4.协同团队成员,推进各项优化技术在实际业务场景中的落地与应用。

岗位要求:
1.计算机、人工智能、软件工程等相关专业硕士及以上学历;
2.掌握大模型推理优化相关技术,具备tensorRT_llm、vllm、sglang等主流开源推理框架开发经验者优先;
3.精通Python/C++编程,有CUDA开发及GPU性能调优实践经验者优先;
4.在顶级会议发表论文、获得竞赛奖项或具备相关实习经历者可获加分。
公司信息
度小满科技(北京)有限公司
明细
北京市海淀区西北旺东路10号院西区4号楼6层606室
云阳人才网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
相似职位
很抱歉,暂无相似职位!