崗位職責:
1.負責大規模分布式深度學習平臺技術研發,主要包括分布式訓練方案設計與實現、分布式訓練任務資源調度、計量與性能優化;
2.負責深度學習相關前瞻技術的跟蹤調研和升級迭代,包括GPU等計算資源虛擬化、算法框架、AutoML、模型壓縮等技術和理論的調研及研究工作;
3.深入主流深度學習框架,針對移動現有模型訓練與推理業務,進行性能優化、定制開發;
4.從軟硬件協同的角度,研究異構芯片、云邊端場景下的深度學習平臺關鍵技術及難點問題。
任職要求:
需求專業:計算機科學與技術、軟件工程、通信工程或其他相關專業。
技能要求:
1.熟悉容器技術,具有Docker、Kubernetes開發或使用經驗;
2.熟練使用Python/Shell/Golang或其他語言,要求編成風格良好,具有復雜業務邏輯的編寫經驗;
3.了解深度學習技術相關框架及算法,有Tensorflow/Pytorch/Caffe等主流框架使用經驗優先;
4.有分布式訓練經驗,對Jupyter、CUDA等技術有了解的優先;
5.有分布式計算、AutoML、模型壓縮等研究經驗優先。
素質要求:
1.有責任心,工作熱情、耐心、踏實、嚴謹,有團隊合作精神;
2.出色的溝通能力,喜歡自我驅動的工作;
3.具備較強的動手實踐能力;
4.具備一定的抗壓能力,有能力應對來自工作上的各種壓力。