崗位職責:
1.負責大模型(視覺或語言)的預訓練開發和調優工作;
2.負責大模型在具體業務場景的適配和應用,如fine-tuning、prompt設計等;
3.負責大模型的推理優化和應用部署,如壓縮量化、推理加速等;
4.負責跟進領域最新進展,預研和評估大模型在機器人領域的應用,如Gato、RT-1、PaLM-E。
任職要求:
1.計算機相關專業,熟悉深度學習、計算機視覺、自然語言處理等領域的專業知識,具有1年以上工作經驗,碩士及以上學歷;
2.熟悉Transformer、BERT、GPT系列、T5、PaLM等模型,對大模型的數據處理及訓練技術有深入理解;
3.熟悉Pytorch/Tensorflow深度學習框架,至少掌握Python或C++其中一種編程語言;
4.熟悉常見的強化學習算法原理(如DQN、DDPG、A3C、PPO等),有相關訓練和開發經驗者優先;
5. 具有TensorRT、ONNX推理優化和部署經驗者優先;
6.曾在AI、CV、NLP頂級會議(如:AAAI、CVPR、ACL等)發表論文者優先。