1.人工智能應用開發:
負責大模型智能體應用在業務場景中的開發工作,將大模型的能力與實際業務需求相結合,并結合視覺、語音、OCR等機器學習算法,構建構建智能體應用,負責智能體應用功能迭代和優化,確保產品的技術領先性和用戶體驗
2.模型開發與優化:
主導AI大模型及其他模型(大語言模型/視覺-語言模型)的訓練調優及部署落地,針對業務場景優化模型性能(推理速度、內存占用等),實現模型輕量化(如量化、剪枝、蒸餾),探索前沿技術(如MoE、RLHF、長上下文建模)提升模型效果;
負責大模型的預訓練、微調及遷移學習,結合業務需求進行模型定制化開發,提升模型在特定場景下的表現。
3.工程化支持:
搭建高可用數據處理Pipeline(清洗、標注、增強),開發模型服務框架,支持高并發推理及動態擴縮容;
與產品團隊協作,推動算法在業務場景中的落地,確保模型的高效部署和穩定運行。
4.算法研究與落地:
研發核心算法(如預訓練、提示工程、模型對齊),解決實際業務中的技術瓶頸,設計高效的分布式訓練方案(數據/模型并行),提升千億級參數模型的訓練效率;
構建自動化評估體系,量化模型在垂類場景中的表現,推動算法在搜索、推薦、對話等場景的落地。
5.技術前瞻性探索:
跟蹤LLM、Agent、AIGC等領域最新進展,主導技術選型,參與開源社區貢獻,推動內部技術成果轉化;
探索大模型與AI應用開發的前沿技術,推動技術創新和業務場景的結合。
任職要求:
1.學歷要求:
研究生及以上學歷,(特別優秀的本科也可以考慮),計算機/數學/AI相關專業。
2.工作經驗:
具備2年以上大模型實戰經驗(需提供項目細節,如模型參數量、數據規模、性能指標),有完整參與從0到1的大模型訓練或產品算法落地案例;
具備大規模分布式訓練經驗,熟悉數據并行、模型并行等訓練策略,能夠優化千億級參數模型的訓練效率。
3.專業技能:
精通Python編程語言,熟練使用PyTorch、PaddlePaddle等深度學習框架,具備CUDA優化經驗;
深入理解Transformer、Diffusion等模型原理及實現細節,熟悉Megatron-LM、DeepSpeed、HuggingFace等開源生態;
熟悉大模型的訓練、微調及部署流程,具備模型輕量化(如量化、剪枝、蒸餾)經驗。
4.其他要求:
具備技術抽象能力,能將業務問題轉化為可建模的算法問題,對技術敏感度高,能快速驗證新技術可行性;
具備跨團隊協作經驗,能清晰傳遞技術價值至非技術人員,推動技術成果在業務場景中的落地。