崗位職責:
1、大模型開發與調優。基于DeepSeek大模型進行垂直領域適配,完成模型訓練、微調(LoRA/P-Tuning)及性能優化;設計知識庫驅動的高效訓練方案,解決幻覺問題并提升專業領域輸出準確性(如醫療術語合規性);
2、知識庫工程化。構建多模態行業知識庫(文本/表格/圖譜),開發數據清洗-向量化-檢索增強(RAG)全流程工具鏈。設計混合檢索策略(關鍵詞+語義),實現知識庫與模型的動態對齊,支持實時增量更新;
3、智能體系統開發。開發基于DeepSeek的智能體框架,實現多輪對話、任務規劃及工具調用(API/數據庫)能力;搭建評估體系,通過人工評估+A/B測試持續優化意圖識別與響應質量
4、工程部署與優化。完成模型量化(GPTQ/AWQ)、蒸餾及本地化部署,確保低資源場景下的推理效率(RTF<0.3);設計監控方案,跟蹤GPU利用率/顯存占用等關鍵指標,實現成本可控的模型服務。
任職要求:
1、熟練掌握PyTorch/TensorFlow框架,3年以上NLP實戰經驗,至少1個大模型落地項目經歷;
2、精通DeepSeek模型架構,有RLHF/DPO等對齊技術實踐經驗,掌握LangChain/LLamaIndex等開發工具;
3、深入理解檢索增強(RAG)、提示工程、Agent開發等關鍵技術點
4、具備知識圖譜構建經驗,熟悉Neo4j/TigerGraph等工具,能設計Schema與抽取規則;
5、熟練使用Docker/K8s進行模型服務化部署,有 Triton推理服務器優化經驗者優先。