大模型算法研发工程师
1.5-2.5万元/月岗位职责
1.主导或参与车载领域大模型的架构设计与研发工作:聚焦车控、导航、娱乐、问答等典型车载场景,开展预训练语言模型的结构设计、持续预训练及对齐优化(SFT/RLHF),提升模型在车载环境中的自然交互、任务理解与个性化服务能力
2.突破大模型训练关键技术瓶颈:深入实践分布式并行训练方法(涵盖数据、张量、流水线并行),优化主流训练框架(如DeepSpeed、Megatron-LM),应对千亿参数级别模型在训练过程中的性能损耗、显存占用与系统稳定性问题
3.设计高效推理与端侧部署方案:研究面向车规级硬件的轻量化推理技术,综合运用模型量化、知识蒸馏、结构剪枝以及动态批处理、KVCache压缩等手段,实现高精度与低资源消耗的协同优化
4.推动前沿技术落地应用:密切关注学术界与工业界最新进展(如MoE架构、多模态融合、智能Agent、RAG部署等),结合车载业务实际需求进行快速原型验证与工程化转化,持续提升模型综合能力边界
5.参与AI底层能力建设:协助搭建覆盖数据处理、预训练、微调到评估上线的全链路大模型研发基础设施,提升团队整体研发效率与系统可维护性
任职要求
1.计算机、人工智能、数学等相关专业本科及以上学历,具备3年以上自然语言处理或深度学习方向的研发经验
2.深入掌握Transformer模型原理,熟悉主流大模型(如LLaMA系列、GPT系列)的技术演进路径与核心机制
3.精通PyTorch或TensorFlow框架,具有扎实的Python/C++编程能力,熟练使用Linux开发环境
4.拥有大规模GPU集群上的训练实践经验,至少掌握一种主流分布式训练框架(如Megatron-DeepSpeed、ColossalAI、FairScale等)
5.熟悉大模型预训练全流程关键技术环节,包括大规模语料清洗、词表构建、预训练任务设计与实施等