logo of xiaohongshu

小红书AI平台高级研发工程师(训练方向)

全职社招机器学习平台地点:北京 | 上海 | 深圳 | 杭州状态:招聘

工作描述


任职要求

任职要求:
1、计算机相关专业本科及以上学历,3年以上后端开发经验
2、精通Go/Java/Python等编程语言,熟悉模型训练全流程,了解PyTorch框架使用
3、具备训练GPU计算优化和大规模集群调度相关经验
4、良好的系统设计能力和问题排查能力,具备训练系统开发经验
加分项:
1、有大模型训练平台开发经验或开源项目贡献经历
2、熟悉DeepSpeedMegatron等分布式训练框架,理解分布式训练技术和优化方法
3、有AI基础设施或云原生相关开发经验

工作职责

1、负责模型训练平台核心功能开发和架构设计,包括传统CN/NLP/SD/LLM等多场景支持
2、负责大模型后训练工具平台化建设,包括后预训练、微调、对齐等技术落地
3、设计和实现高性能分布式训练系统,打造端到端训练解决方案
4、优化训练调度和资源管理,提升集群利用率和训练效率
5、开发模型训练监控诊断工具,建设可观测性体系
包括英文材料
学历
后端开发
Go+
Java+
Python+
PyTorch+
大模型+
DeepSpeed
Megatron