崗位職責:
1. 參與基于深度學習和大語言模型(如 Transformer、GPT、BERT 等)的算法開發、優化及部署;
2. 負責大語言模型的微調、優化、推理加速及部署
3. 研究并實現前沿的自然語言處理(NLP)技術,提升模型在文本生成、語義理解、問答系統等任務上的表現;
4. 參與大模型訓練數據的清洗、整理和增強,提升模型的泛化能力和魯棒性;
5. 設計并優化模型評估方法,提升訓練和推理效率,降低計算資源消耗;
6. 參與相關應用系統的開發,包括 API 接口封裝、模型服務化、工程部署等;
7. 關注前沿 AI 研究成果,分析行業趨勢,并推動新技術的落地和應用;
8. 配合產品團隊,支持基于大模型的智能應用(如智能助手、自動摘要、代碼生成等)的開發與優化。
任職要求:
1. 計算機、人工智能、數學、統計學或相關專業,碩士及以上學歷(優秀者可放寬至本科);
2. 熟悉深度學習框架(如 TensorFlow、PyTorch),具有大規模模型訓練和優化經驗;
3. 熟悉 Transformer 結構,掌握主流大語言模型(如 GPT、LLaMA、T5、Mistral)的架構及訓練方法;
4. 具備扎實的 Python 編程能力,熟悉 C++/CUDA 者優先;
5. 具備 NLP 相關任務(如文本分類、文本生成、知識圖譜等)的實戰經驗;
6. 具備良好的數學基礎,熟悉優化算法、概率統計、信息論等相關知識;
7. 具備較強的團隊合作能力、學習能力和問題解決能力,能夠快速適應新技術;
8. 發表過相關學術論文(如 NeurIPS、ICLR、ACL、CVPR)或有開源項目經驗者加分。
9. 對機器數據模型有了解者加分(如Yolo,ResNet等)。
加分項:
1. 有大模型 LoRA、QLoRA、MoE 相關經驗;
2. 具備模型蒸餾、剪枝、量化等模型優化經驗;
3. 熟悉 AI 推理加速(如 TensorRT、ONNX Runtime)或高性能計算(HPC);
4. 熟悉云端 AI 訓練與推理環境(如 Hugging Face、DeepSpeed、ColossalAI)。