職位描述
職位描述
1. 負責多模態文檔解析模型的訓練、調優、評測和部署;
2. 研究業務場景中版面分析、表格解析、全文解析的實現及優化,助力多模態大模型(LMM)在金融文檔解析和信息抽取上落地;
3. 跟蹤最新的 LMM 及人工智能領域進展,持續進行新技術迭代;
4. 進行文檔場景、多模態場景相關的數據采集、清洗和制備。
職位要求
1. 本科及以上學歷,計算機科學、數學、統計學等相關專業優先;
2. 具備扎實的 Python 編程能力,熟悉至少一種深度學習框架,能夠在較短時間內理解源碼,代碼書寫規范,具有良好的編程能力和扎實的數學理論基礎;
3. 具備OCR、文檔解析和多模態相關經驗,熟悉 Qwen2.5-VL、GOT-OCR2.0等模型,有多模態大模型(LMM)相關經驗者優先;
4. 熟練掌握 Linux 常用命令,熟悉Vim、Git 工具;
5. 有良好的文檔書寫習慣,能夠編寫規范化的技術文檔;
6. 表達清晰,溝通順暢,具備良好的團隊協作和溝通能力;
7. 熟悉多模態方向的最新技術進展,關注行業前沿,對技術開發及應用有熱情,有自己的想法并樂于挑戰自我