崗位職責:
1、負責大規模語言模型(LLM)的微調、優化及部署,提升模型在垂直領域的性能。
2、結合知識圖譜技術,構建領域知識增強的大模型應用,解決復雜語義理解與推理問題。
3、開發基于大模型與知識圖譜的智能應用(如問答系統、推薦系統、自動化決策等)。
4、跟蹤大模型前沿技術(如LoRA、P-Tuning、RLHF等),探索模型輕量化與落地方案。
5、參與數據治理與知識圖譜構建,設計結構化與非結構化數據的融合方案。
任職要求:
技術能力:
大模型方向
1、精通Transformer架構及主流大模型(如GPT、LLaMA、ChatGLM等)的微調技術。
2、熟悉Prompt Engineering、Adapter tuning、RLHF等優化方法,有實際調參經驗。
3、掌握Hugging Face、LangChain等生態工具,熟悉分布式訓練框架(DeepSpeed、Megatron-LM)。
知識圖譜方向
1、熟悉知識圖譜構建全流程(實體抽取、關系抽取、圖譜存儲與推理)。
2、熟練使用Neo4j、Dgraph等圖數據庫,或Apache Jena等語義框架。
3、有基于大模型的知識抽?。ㄈ鏝ER、RE)或圖譜問答(KBQA)項目經驗者優先。
編程與工具
1、精通Python,熟悉PyTorch/TensorFlow框架,具備高性能代碼優化能力。
2、熟悉Linux開發環境,掌握Docker/Kubernetes部署,了解CUDA加速。
加分項:
1、發表過NLP/知識圖譜相關頂會論文(ACL、EMNLP等)。
2、熟悉多模態大模型(如Flamingo、BLIP-2)或圖神經網絡(GNN)。
3、有云計算平臺(AWS/Azure/阿里云)大模型服務部署經驗。
學歷與經驗:
計算機/人工智能相關專業碩士及以上學歷,5年以上工作經歷,3年以上NLP或知識圖譜項目經驗。優秀的學習能力,能快速復現前沿論文并解決實際問題。