更新于 4月16日

大模型系統部署與優化工程技術崗(FXQ26)

面議
  • 合肥蜀山區
  • 1-3年
  • 碩士
  • 全職
  • 招1人

職位描述

大模型算法人工智能
崗位職責: 1.負責大模型在云端或邊緣設備上的部署與優化,使用Docker 進行容器化部署,結合 ?TensorRT或ONNX Runtime進行模型優化,確保高效推理和資源利用; 2.設計和實現大模型的分布式推理框架,支持高并發、低延遲的場景需求; 3.結合硬件(Nvidia、昇騰GPU,NPU,VPU,IPU等)特性進行模型推理加速,優化部署性能; 4.監控和調優模型部署后的性能,解決實際運行中的瓶頸問題; 5.編制相關技術文檔,確保部署流程的可復現性和可維護性; 6.完成主管領導交辦的其他工作。 任職條件: 1.學歷: 碩士研究生及以上; 2.專業: 計算機、自動控制、人工智能、機器人等相關專業; 3.經驗及行業背景: 2年以上相關工作經驗; 4.特殊要求(知識、技能等): (1)深入理解深度學習的基本原理,熟悉主流神經網絡架構(如Transformer、CNN、GRU、SNN等),精通模型的訓練與推理流程; (2)了解GPU、TPU、VPU、AI芯片等硬件加速技術,熟悉CUDA、OpenCL等編程模型; (3)熟悉TensorRT、ONNX Runtime、TVM等推理引擎,能夠優化模型在特定硬件上的推理性能; (4)參與過大模型部署與優化的實際項目經驗者優先; (5)具有較強的責任心、良好的溝通能力、組織協調能力與執行力。

工作地點

合肥蜀山區中安創谷科技園二期-H6棟

職位發布者

余沛文/人事經理

立即溝通
江淮前沿技術協同創新中心
江淮前沿技術協同創新中心(簡稱江淮中心)成立于2021年9月,坐落在安徽省合肥市,是安徽省委批準設立、省部共建的新型研發機構,省直事業單位,企業化運行。江淮中心以加快建設世界重要人才中心和創新高地為指引,以打造戰略科技創新重要一極為目標,圍繞智能科技和人形機器人主軸主線,聚焦智能技術、無人系統、共性平臺等領域方向,開展前沿技術顛覆性創新與成果快速轉化,聯合優勢共建單位,構建“1+N+1”式發展格局,探索協同創新組織模式與新機制,塑造科技與產業創新發展的重要策源地。
公司主頁
日韩欧美视频一区二区