職責描述:
1、基于公司業務場景,負責大規模方向的研發工作,包括但不限于NLP、CV及多模態等領域;
2、深入理解業務需求,完成垂直領域大模型精調與輕量化部署,構建Agent應用,支撐產品能力需求;
3、參與構建高質量的數據集,基于實際需求進行深入分析以指導后續改進方向;
4、將開發完成的模型部署到生產環境中,配合相關團隊完成系統的聯調聯試,確保其穩定可靠地運行;
5、構建和維護大模型的測試框架,優化測試流程,提升測試效率。
6、深入分析測試數據,提取關鍵性能指標,為模型優化提供數據支持。
7、跟蹤相關領域技術動態,撰寫技術報告,為團隊技術發展提供建議和支撐
任職要求:
1、擁有計算機科學、人工智能、數學等相關專業碩士及以上學位者優先考慮;
2、熟練掌握Python,精通TensorFlow、PyTorch等至少一種主流深度學習框架;
3、對機器學習、深度學習理論有深刻理解;熟悉NLP或CV領域常用技術和工具;
4、熟悉大模型SFT訓練方法,包括LoRA、P-tuning、Prefix-Tuning等,具有大模型訓練、性能調優經驗;
5、了解常用的大模型能力評測Benchmark,對大模型能力評測體系和系統有基本了解;
6、具有垂直領域LangChain、LLaMAIndex、AutoGPT應用開發落地經驗者優先;
7、英文讀寫流利,能夠無障礙閱讀英文文獻資料;
8、具備良好的溝通協調能力和團隊合作精神,心態樂觀、積極面對挑戰。