知乎原帖:
https://zhuanlan.zhihu.com/p/1904176362274653067
欢迎在校学生报名~ 简历发邮箱:xiaotang.jxt@taobao.com基于深度学习引擎 MNN实现移动端大模型部署方案,具体包括:支持各类的AIGC模型如StableDiffusion/LLM/VLM的模型转换;研发LLM 算子加速方案,充分利用 CPU / GPU / NPU 算力;研发LLM 解码加速方案,如 KV Cache压缩、投机采样等;1、擅长c/c++编程,熟悉Python/java中一种;2、熟练掌握TensorFlow/Pytorch/MNN等至少一种深度学习框架,对深度学习模型有一定了解;3、熟悉轻量化深度学习模型蒸馏、剪枝、量化等,有实际项目开发经历;5、擅长汇编语言、neon、mmx指令集编程加分;有实际的OpenCL开发经历、深度学习模型网络结构优化、内存优化经验加分;7、熟悉LLM(大语言模型)结构,并有训练大模型的经验加分。
点击【轻松参会】小程序全部CCF目录会议查截稿/进投稿交流群
点击【轻松参会】小程序查询最新AI/CS硕博招生/科研实习/大厂招聘/博后教职信息
【轻松参会】为所有CCF收录会议与期刊设立投稿交流群,后台回复会议名/期刊名即可进群。公众号文章会发布近期截稿会议、转投会议推荐、录用率趋势、录用分数分析等重要信息,同时会发布最新的CS/AI招聘招生信息。