崗位職責:
1. 根據公司實際業務情況,選擇適合的開源模型并進行私有化部署和維護;
2. 構建高效、可擴展的 AI 大模型架構,包括但不限于Transformer架構的變體等,以滿足不同業務場景下的需求;
3. 對模型壓縮、量化、蒸餾等技術及模型參數的調優有研究和應用;
4. 收集、梳理大規模數據,進行數據清洗和預處理,確保數據的質量和一致性,同時對數據進行標注和分類,為模型訓練提供高質量的標注數據。運用數據分析和挖掘技術,從數據中提取有價值的信息和特征,為模型訓練和優化提供支持。
任職要求:
1. 計算機科學、信息技術、人工智能、數學、統計學等相關專業本科、碩士學歷;
2. 熟練掌握 Python、Java、C++ 等編程語言,具備良好的數據結構和算法基礎;
3. 了解TensorFlow、PyTorch 等深度學習框架,能夠進行模型的訓練和優化;
4. 了解并應用多模態技術和框架結構以及其原理和應用場景;
5. 對主流的Deepseek、Kimi、豆包、通義千問、智譜等大模型有深入研究和應用,對模型訓練和微調經驗;
6. 了解和熟悉機器學習算法和深度學習模型;
7. 掌握數據挖掘、數據清洗、數據預處理等技術,能夠熟練使用SQL/Hive/Spark相關工具和算法對大規模數據進行處理和分析;
8. 具備良好的團隊合作精神,能夠與不同背景的人員進行有效的溝通和協作;
9. 具備較強的學習能力和問題解決能力,能夠學習新技術和新知識,定位和解決模問題。