大模型开发工程师
1.7-1.9万元/月
更新 2025-12-14 14:30:57
浏览 448
职位详情
大模型算法
5-10年
智能体 · 多模态 · 深度学习 · ai · 微调 · rag · 大模型 · llm
职位描述:
1.负责行业大模型的训练与微调工作,攻克模型在文本、图像及语音等多模态信息输入下的理解与融合处理难题,提升模型训练效率与整体性能
2.搭建并维护大规模数据处理与分析流程,涵盖数据采集、清洗、结构化、自动化合成及混合策略等相关技术实现
3.与数据标注、基础设施工程等团队紧密协作,协同推进数据、训练和评估流程的持续优化
4.主导行业大模型项目在训练、微调、评测等方面的实践总结,沉淀可复用的技术方法与工具能力
5.持续关注大模型领域的前沿进展,具备算法原型设计与验证的落地能力
任职要求
1.计算机科学、人工智能或相关专业本科及以上学历
2.熟悉机器学习与深度学习理论,尤其在多模态学习方向有扎实积累
3.掌握Langchain、DeepSpeed、LlamaFctory、TensorRT-llm、Vllm、Ollama、LMStudio等主流框架
4.精通Python编程,熟悉django、flask、FastAPI等Web开发框架
5.熟悉Linux系统操作与管理,熟练使用docker、git等开发工具
6.具备良好的责任心与抗压能力,拥有团队协作意识及独立分析解决问题的能力
7.具备优秀的技术文献阅读和技术文档撰写能力
8.追求模型性能的极致提升,不满足于现有成果,具备持续改进的动力与热情
1.负责行业大模型的训练与微调工作,攻克模型在文本、图像及语音等多模态信息输入下的理解与融合处理难题,提升模型训练效率与整体性能
2.搭建并维护大规模数据处理与分析流程,涵盖数据采集、清洗、结构化、自动化合成及混合策略等相关技术实现
3.与数据标注、基础设施工程等团队紧密协作,协同推进数据、训练和评估流程的持续优化
4.主导行业大模型项目在训练、微调、评测等方面的实践总结,沉淀可复用的技术方法与工具能力
5.持续关注大模型领域的前沿进展,具备算法原型设计与验证的落地能力
任职要求
1.计算机科学、人工智能或相关专业本科及以上学历
2.熟悉机器学习与深度学习理论,尤其在多模态学习方向有扎实积累
3.掌握Langchain、DeepSpeed、LlamaFctory、TensorRT-llm、Vllm、Ollama、LMStudio等主流框架
4.精通Python编程,熟悉django、flask、FastAPI等Web开发框架
5.熟悉Linux系统操作与管理,熟练使用docker、git等开发工具
6.具备良好的责任心与抗压能力,拥有团队协作意识及独立分析解决问题的能力
7.具备优秀的技术文献阅读和技术文档撰写能力
8.追求模型性能的极致提升,不满足于现有成果,具备持续改进的动力与热情
相似职位
很抱歉,暂无相似职位!