任職資格:
1.研究生及以上學歷(計算機科學與技術、信息與通信工程、電子科學與技術、軟件工程、交通運輸工程、含相關學位的專業或方向);
2.三年及以上工作經驗;
3.英語6級(CET-6)或同等水平以上;
4.具備三年以上計算機自然語言、視覺或多模態生成等相關領域模型訓練、推理部署等工作經驗;
5.熟悉深度學習大模型相關主要工具和主流經典AI模型,如BERT、GPT、ViT、CLIP或Stable Diffusion、deepseek等;
6.熟悉模型預訓練和調優過程,了解模型量化、蒸餾等模型輕量化技術,以及推理部署參數調優技術;
7.掌握Python語言,熟悉Flask,FastAPI等Python主要框架;熟悉Linux開發環境;熟悉Pytorch、TensorFlow、MindSpore等深度學習框架;
8.良好的英文閱讀能力,強烈的人工智能領域新知識學習興趣;
9.有交通運輸類、金融類大模型建設經驗者優先;
10.身體健康,吃苦耐勞,有創新精神。
崗位概述:
1.負責主流模型在服務器上的部署;能夠進行大量數據的向量化處理,符合RAG需要;
2.構建自動化模型推理部署技術流程,開發相關系統;
3.開展模型量化、蒸餾等模型小型化技術,以及推理相關參數優化技術的研究;
4.根據實際應用場景,參與大模型全流程的研發工作,包括客戶需求分析、系統方案設計、數據處理、算法模型設計、模型開發、訓練、部署、調試、評測、業務聯合調試等;
5.掌握大模型的優化技術,掌握基本的處理數據稀疏問題和長距依賴問題的辦法;
6.積極探索和跟進技術前沿方向,在實際業務場景落地并沉淀通用的算法能力或解決方案;
7.公司安排的其他事項。