参与研发大规模AI模型的算法应用与平台化落地。包括但不限于:
1. 在真实业务场景中,设计、实现和完善模型,迭代文本生成、内容理解、多模态理解等任务的业务效果,推动AI应用落地;
2. 参与语言模型的训练优化、推理加速、部署优化等工作;
3. 探索并应用知识增强、检索增强、强化学习等技术,并用于提升业务要求匹配度;
4. 参与NLP、知识图谱、多模态模型相关技术前沿研究,驱动技术发展与落地。
1. 计算机、电子、数学、机器学习或相关专业方向硕士及以上学历;
2. 在自然语言处理、信息检索、分布式系统、知识图谱、多模态中至少一个方向有丰富项目经验,以第一作者身份发表过相关领域顶级会议论文者优先;
3. 熟练掌握C/C++/Java/Scala/Go中的至少一种语言,并熟悉主流机器学习框架;
4. 优秀敏捷的工程能力、逻辑思维和沟通表达能力;
6. 对AI有强烈的热情与自驱力,紧跟AI开源社区相关进展并做过动手实践。