更新于 3月31日

AI訓練數據工程師(數據準備方向)

4-7萬·14薪
  • 廣州海珠區
  • 1-3年
  • 本科
  • 全職
  • 招1人

職位描述

AI算法機器學習
崗位職責:
1、負責AI訓練數據的全流程管理:清洗、標注、增強、版本控制及質量評估;
2、負責多模態訓練數據(文本、圖像、語音、視頻等)的采集、清洗與結構化處理,制定數據質量標準,確保數據集的多樣性、代表性和合規性;
3、開發自動化工具或腳本(如Python/Pandas)處理大規模數據,解決噪聲過濾、重復數據刪除、格式統一等問題;
4、設計數據標注規則與流程,確保標注結果的一致性與準確性(如實體識別、語義分割、意圖分類等任務);
5、通過應用數據增強技術(如文本擴寫、圖像變換、對抗生成)提升數據量級與多樣性,優化模型泛化能力;
6、設計數據標注規則與SOP,搭建自動化數據處理Pipeline;
7、開發數據合成工具(如基于Diffusion模型生成圖像數據);
8、保障數據安全合規,制定隱私脫敏與版權管理策略。
任職要求:
1、計算機/統計學相關專業本科以上學歷,2年以上數據工程經驗;
2、精通Python/SQL,熟練使用數據處理庫(如Pandas、NumPy)及分布式計算工具(Spark、Dask)。
3、熟悉主流標注工具(Label Studio/CVAT)及數據湖架構;
4、了解數據標注行業生態,熟悉GDPR/《個人信息保護法》等數據合規要求;
5、參與過大模型預訓練數據建設(如RedPajama/The Pile);
6、熟悉房地產業務場景的數據特點與標注規范者優先。

工作地點

廣州海珠區保利國際廣場12樓

職位發布者

鄒女士/HR

立即溝通
公司Logo保利和潤房地產投資顧問有限公司公司標簽
保利和潤房地產投資顧問有限公司(以下簡稱“保利和潤”)是央企保利發展控股全資子公司,由保利發展控股旗下經紀板塊載體保利投顧升級而來?;诒@额櫳罡麪I銷領域21載優勢和實力,保利和潤致力打造全域營銷生態圈,代運營保利云和+線上房產平臺,核心業務包括保利和潤新房代理、房小寶新房分銷和保利愛家存量房租售,業務覆蓋超100座城市,同期代理項目超700個,公司已經連續十年獲得“中國房地產策劃代理百強企業十強”。
公司主頁
日韩欧美视频一区二区