一、崗位職責
1、算法研發與優化
參與計算機視覺相關算法開發,包括但不限于OCR(文字檢測/識別)、視頻分析(行為識別、時序建模)、目標檢測、圖像分類等方向,負責模型設計、訓練、調優及部署落地;
探索多模態大模型(如視覺-語言模型)在業務場景中的應用,包括模型輕量化、指令微調、知識蒸餾等技術優化;
針對實際業務需求(如低資源場景、實時性要求),設計高效算法解決方案。
2、大模型技術實踐
參與大規模預訓練模型(CV/NLP/多模態方向)的訓練、微調及性能優化,解決分布式訓練、顯存優化、模型壓縮等問題;
結合業務數據,設計prompt工程、數據增強、模型評測方案,提升大模型在垂直領域的泛化能力。
3、技術研究與工程支持
負責計算機視覺領域前沿算法和系統的跟進與研究,
協助完成數據處理、特征工程、模型部署,
負責算法在應用領域的性能優化和落地
二、任職要求
1、基礎要求
本科及以上學歷,計算機科學、電子工程、數學、自動化等相關專業;
扎實的編程能力,熟練使用Python,熟悉PyTorch/TensorFlow等深度學習框架,掌握數據結構與算法設計。
2、技術能力
計算機視覺方向:
熟悉CV領域經典任務(如OCR中的CTPN/DBNet/CRNN,目標檢測中的YOLO系列、Faster R-CNN等);
具備實際項目經驗,如文檔解析、視頻內容理解、圖像分割等。
大模型技術棧:
熟悉Transformer架構及主流大模型(如CLIP、LLaMA、Stable Diffusion),了解預訓練、指令微調、RLHF等技術;
有分布式訓練(Deepspeed/Megatron)、模型量化/剪枝、LoRA/P-Tuning等輕量化經驗者優先。
加分項:
在CVPR/ICCV/ECCV/NeurIPS等頂會發表論文,或在Kaggle、天池等競賽中取得優異成績;
熟悉多模態技術(如視覺問答、圖文生成)、強化學習或AutoML工具鏈;
有開源項目貢獻或技術博客撰寫經驗,代碼工程能力突出。
軟性要求:
邏輯清晰,具備快速學習與解決問題能力,對技術落地有強烈興趣;
良好的溝通能力與團隊協作意識,能適應快節奏的研發環境。
工作地點:杭州 余杭區