返回 职位详情 登录/注册
通义实验室-AI服务-检索增强(RAG)
2.5-5万元/月
定位 杭州西湖区阿里巴巴云谷园区1号楼
更新 2025-12-21 14:35:17 浏览 356
职位详情
Java 5-10年 Java · C++ · AI · RAG
通义实验室工程团队专注于构建面向公众与企业的大规模、高性能在线AI服务平台,全面支持通义千问、通义万相及多种前沿开源模型的线上服务运行,并积极推进AIAgents、多模态应用、MCP等创新技术的产品化实践。
团队持续应对异构GPU资源调度、跨地域多模型部署、多模态任务统一推理、多层次服务等级保障(SLO)以及模型推理端到端工程化等核心技术难题,不断优化系统性能、稳定性与资源利用效率。

1、基于LLM技术,设计并优化RAG全流程基础架构,提升系统整体吞吐量与响应效率;

2、研发高吞吐、可扩展的分布式文档处理与索引构建体系,满足大规模知识库在索引生成与检索场景下的核心需求;

3、负责检索集群的架构规划与性能调优,通过合理分片策略与资源分配机制降低延迟、提升吞吐,结合具体业务场景实施针对性优化;

4、搭建完整的系统监控体系,集成日志分析与链路追踪平台,实现问题的快速定位与高效处理。

职位描述
1、计算机或人工智能相关专业硕士及以上学历,具备5年以上开发经验,熟练掌握C++/Java/Go中至少一门编程语言,有大型分布式系统实际开发经历者优先;

2、了解信息检索基本理论,具备高并发在线服务系统开发背景者优先;

3、熟悉Linux操作系统,能熟练运用Unixshellscripting、Perl或Python等脚本工具;

4、深入理解数据结构与算法设计,具备较强的逻辑分析与问题解决能力,热衷于攻克复杂技术难题;

5、精通搜索推荐引擎的在线与离线系统架构,掌握索引机制、缓存策略、负载均衡及分布式系统基础原理;

6、具备关键字检索或向量检索系统实践经验者优先。
公司信息
阿里云计算有限公司
明细
浙江省杭州市西湖区三墩镇灯彩街1008号云谷园区1-2-A06室
云阳人才网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
相似职位
很抱歉,暂无相似职位!