【小红书】AI平台高级研发工程师(训练方向)
全职社招机器学习平台地点:北京 | 上海 | 深圳 | 杭州状态:招聘
工作描述
任职要求
任职要求: 1、计算机相关专业本科及以上学历,3年以上后端开发经验 2、精通Go/Java/Python等编程语言,熟悉模型训练全流程,了解PyTorch框架使用 3、具备训练GPU计算优化和大规模集群调度相关经验 4、良好的系统设计能力和问题排查能力,具备训练系统开发经验 加分项: 1、有大模型训练平台开发经验或开源项目贡献经历 2、熟悉DeepSpeed、Megatron等分布式训练框架,理解分布式训练技术和优化方法 3、有AI基础设施或云原生相关开发经验
工作职责
1、负责模型训练平台核心功能开发和架构设计,包括传统CN/NLP/SD/LLM等多场景支持 2、负责大模型后训练工具平台化建设,包括后预训练、微调、对齐等技术落地 3、设计和实现高性能分布式训练系统,打造端到端训练解决方案 4、优化训练调度和资源管理,提升集群利用率和训练效率 5、开发模型训练监控诊断工具,建设可观测性体系
包括英文材料
学历
后端开发
Go+
https://www.youtube.com/watch?v=8uiZC0l4Ajw
学习Golang的完整教程!从开始到结束不到一个小时,包括如何在Go中构建API的完整演示。没有多余的内容,只有你需要知道的知识。
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
Python+
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
PyTorch+
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
DeepSpeed
Megatron