阿里云智能-大模型应用算法专家/高级工程师
3.5-6.5万元/月
更新 2025-12-21 14:30:07
浏览 701
职位详情
算法工程师
3-5年
C/C++ · 机器学习 · 深度学习 · 大模型算法 · 自然语言处理算法 · 多模态算法 · Python
【部门介绍】
阿里云智能大数据和智能实验室专注于推动通义大模型在各行业的深度应用,致力于实现AI大模型时代下的产业智能化转型。团队核心方向涵盖行业语言大模型、多模态大模型及基础性大模型研究,技术成果已广泛应用于智慧交通、城市治理、生物医疗以及大型国际赛事(亚运会和奥运会)等场景。
【工作内容】
1、开展大模型核心技术的研发工作,深入掌握其运行机制,持续探索前沿技术路径及其实际应用场景;提升模型在复杂任务中的推理能力scalingup,研究Post-training相关新技术,如AgentRL、testtimelearning,同时指导researchintern完成技术实践,积累研究成果,增强团队在AI技术领域的影响力与产品竞争力,助力业务长期发展。
2、持续推进大模型效果优化,运用高效的Post-training方法(如SFT、RL等),提升LLM在特定领域任务中的表现力,支持通义系列模型的规模化落地与普惠化推进。
【职位要求】
1.能够通过高效Post-training方式(如SFT、RL等)优化LLM在具体业务场景中的性能表现,支撑通义AI的广泛应用与调用规模扩展,在NeurIPS、ICLR、ICML、ACL等国际顶级会议发表过论文者优先考虑。
2.计算机、人工智能、数学等相关专业硕士及以上学历,具备3年以上机器学习或大模型研发经验,熟悉Qwen等主流大模型结构,拥有扎实的模型训练与调优经验,掌握LLMAgent、RLHF、AgentRL等训练技术,具备分布式训练框架与高效训练策略实践经验者优先。
3.关注复杂问题推理能力的提升与scalingup,积极探索Post-training前沿方向,如AgentRL、TestTimeLearning,能独立主导从问题建模、数据处理、算法设计到实验验证的全流程技术闭环,有高质量大模型开源项目贡献经历者优先。
4.拥有丰富的大模型项目实战背景,具备较强的业务洞察力,沟通协作能力强,具有良好的跨团队合作意识,能够高效推进项目实施与落地。
阿里云智能大数据和智能实验室专注于推动通义大模型在各行业的深度应用,致力于实现AI大模型时代下的产业智能化转型。团队核心方向涵盖行业语言大模型、多模态大模型及基础性大模型研究,技术成果已广泛应用于智慧交通、城市治理、生物医疗以及大型国际赛事(亚运会和奥运会)等场景。
【工作内容】
1、开展大模型核心技术的研发工作,深入掌握其运行机制,持续探索前沿技术路径及其实际应用场景;提升模型在复杂任务中的推理能力scalingup,研究Post-training相关新技术,如AgentRL、testtimelearning,同时指导researchintern完成技术实践,积累研究成果,增强团队在AI技术领域的影响力与产品竞争力,助力业务长期发展。
2、持续推进大模型效果优化,运用高效的Post-training方法(如SFT、RL等),提升LLM在特定领域任务中的表现力,支持通义系列模型的规模化落地与普惠化推进。
【职位要求】
1.能够通过高效Post-training方式(如SFT、RL等)优化LLM在具体业务场景中的性能表现,支撑通义AI的广泛应用与调用规模扩展,在NeurIPS、ICLR、ICML、ACL等国际顶级会议发表过论文者优先考虑。
2.计算机、人工智能、数学等相关专业硕士及以上学历,具备3年以上机器学习或大模型研发经验,熟悉Qwen等主流大模型结构,拥有扎实的模型训练与调优经验,掌握LLMAgent、RLHF、AgentRL等训练技术,具备分布式训练框架与高效训练策略实践经验者优先。
3.关注复杂问题推理能力的提升与scalingup,积极探索Post-training前沿方向,如AgentRL、TestTimeLearning,能独立主导从问题建模、数据处理、算法设计到实验验证的全流程技术闭环,有高质量大模型开源项目贡献经历者优先。
4.拥有丰富的大模型项目实战背景,具备较强的业务洞察力,沟通协作能力强,具有良好的跨团队合作意识,能够高效推进项目实施与落地。
相似职位
很抱歉,暂无相似职位!