工程岗(大模型领域)
1.7-2.2万元/月
更新 2025-10-27 13:59:09
浏览 704
职位详情
大模型算法
1-3年
大模型
岗位职责:
1.硕士及以上学历,计算机科学与技术专业优先,计算机、人工智能、大数据知识工程、电子信息、通信等相关专业亦可。
2.具备良好的编程习惯与文档编写能力,具备多人协作开发及代码评审经验,对代码质量有严格标准;熟悉常见开发规范,熟练使用git等开发工具,掌握代码库的搭建与维护操作。
3.掌握深度学习基本理论,至少熟练使用一种深度学习框架,如PyTorch、TensorFlow、Paddle、MindSpore等,具备模型开发、部署与微调的实际经验。
4.对Transformer结构和深度学习有较深理解与实践经验,能够基于论文复现算法,具备大规模预训练模型研发与训练经验者优先;在ACL、EMNLP、COLING、NAACL等高水平会议发表过相关论文者优先。
任职要求:
1.从事预训练模型相关研究工作,涵盖数据清洗、算法设计、训练推理、模型压缩等方向。
2.与团队成员协作推进项目,完成各类模块或功能的设计与实现,并进行性能优化;解决大规模预训练模型研发中的算法难题,如模型评估、缓解模型幻觉等问题。
3.持续创新:主动探索新技术方案,不断提升开发效率及团队协同开发水平。
1.硕士及以上学历,计算机科学与技术专业优先,计算机、人工智能、大数据知识工程、电子信息、通信等相关专业亦可。
2.具备良好的编程习惯与文档编写能力,具备多人协作开发及代码评审经验,对代码质量有严格标准;熟悉常见开发规范,熟练使用git等开发工具,掌握代码库的搭建与维护操作。
3.掌握深度学习基本理论,至少熟练使用一种深度学习框架,如PyTorch、TensorFlow、Paddle、MindSpore等,具备模型开发、部署与微调的实际经验。
4.对Transformer结构和深度学习有较深理解与实践经验,能够基于论文复现算法,具备大规模预训练模型研发与训练经验者优先;在ACL、EMNLP、COLING、NAACL等高水平会议发表过相关论文者优先。
任职要求:
1.从事预训练模型相关研究工作,涵盖数据清洗、算法设计、训练推理、模型压缩等方向。
2.与团队成员协作推进项目,完成各类模块或功能的设计与实现,并进行性能优化;解决大规模预训练模型研发中的算法难题,如模型评估、缓解模型幻觉等问题。
3.持续创新:主动探索新技术方案,不断提升开发效率及团队协同开发水平。
相似职位