• 移動端
    訪問手機端
    官微
    訪問官微
    搜索
    取消
    溫馨提示:
    敬愛的用戶,您的瀏覽器版本過低,會導致頁面瀏覽異常,建議您升級瀏覽器版本或更換其他瀏覽器打開。

    廣西北部灣銀行:OCR審單平臺,打造OCR“訓管用”綜合服務體系

    來源:中國電子銀行網 2023-04-20 17:33:12 數字金融創新大賽 廣西北部灣銀行 數智平臺
         來源:中國電子銀行網     2023-04-20 17:33:12

    核心提示OCR審單平臺通過OCR+NLP技術充分挖掘行內非結構化圖像數據的應用價值,構建模型訓練+模型管理+模型應用OCR服務體系。

    第六屆(2023)數字金融創新大賽專題

    案例名稱

    OCR審單平臺,打造OCR“訓管用”綜合服務體系

    案例簡介

    廣西北部灣銀行OCR審單平臺項目旨在通過OCR+NLP技術充分挖掘行內非結構化圖像數據的應用價值,構建模型訓練+模型管理+模型應用OCR服務體系。通過平臺輸出模型訓練、管理、應用綜合能力,高效響應行內憑證、單據、票據、合同等文件OCR識別模型樣式多、更新迭代快需求,推進OCR模型在智慧運營、智慧信貸、智慧辦公等方面落地應用,助力非結構化數據賦能業務流程再造,加快全行數字化轉型進程。

    創新技術/模式應用

    廣西北部灣銀行OCR審單平臺包括模型訓練平臺、模型集中管理平臺、模型應用發布3大模塊,對OCR模型“訓”“管”“用”“優”全生命周期開展管理及應用。

    一、OCR+NLP訓練平臺,降低模型研發門檻。OCR審單平臺內置算法類型覆蓋90%以上銀行業務場景的非結構化影像及文件類型,包括但不限于業務單據、單證、票據、合同類長文本等,以深度學習網絡對各類銀行業務單證的原始圖像進行特征學習。平臺支持錨點、KV、NLP模型構建方式,提供全流程可視化操作界面,行內業務人員可自主完成固定版式、非固定版式OCR模型開發、訓練、調優。

    二、自動預標注,提升數據標注質效。OCR審單平臺支持以傳統數據導入人工標注方式進行訓練數據標注。此外,平臺基于內置高性能預訓練模型,實現通過模型對導入樣本數據進行預標注處理,預標注處理后的數據可進行手工調整標注結果,數據標注人員僅通過核對預標注結果即能完成數據標注工作,大幅度提高數據標注人員的工作效率,進一步確保數據標注結果的準確性。

    三、統一管理,降低模型維護成本。OCR審單平臺可對存量及新增模型進行集中管理及發布,實時監控各OCR模型調用情況,提供統一對外接口供行內各關聯系統調用,以可視化圖表形式展示不同渠道、不同模型調用情況,打通OCR模型使用壁壘,降低OCR模型復用及遷移成本。

    四、自主設置規則,拓展模型應用場景。OCR審單平臺支持可視化配置比對規則,實現以圖形化的操作完成識別結果的邏輯處理,輸出規則比對結果可直接供下游系統使用,替代用戶對不同識別結果初步的邏輯處理工作。平臺配置低代碼模塊,即用戶可根據實際業務建模需要,將多個模型通過可視化托拉拽的方式將模型串并聯組合應用,實現“一模型,多功能”。

    五、用訓一體化服務,滿足新業務缺樣本場景及模型自動化迭代的需求。OCR審單平臺通過與行內業務系統打通,搭建生產數據回流機制。用戶可按需選擇將實際工作流中識別錯誤的源文件,或全部參與識別的源文件回流至平臺,通過系統之間交互收集模型優化樣本數據,滿足缺樣本場景下模型迭代升級需求。同時,平臺支持對少量真實樣本學習生成虛擬數據,采用真實+虛擬數據混合訓練模式完成OCR模型開發。

    項目效果評估

    廣西北部灣銀行OCR審單平臺項目通過降低圖像識別模型研發門檻,綜合提升行內OCR模型應用及管理能力,實現模型訓練低門檻、數據標注高效率、模型開發降成本、模型管理成體系、場景應用高響應的應用效果。

    一、提升模型自研能力,降低開發成本。OCR審單平臺引入了國內領先的深度學習框架和圖像識別算法,降低圖像識別技術應用門檻。依托平臺,用戶可進行數據標注、模型訓練、模型后配置等操作自行完成定制化單據、憑證OCR識別模型訓練與開發,一定程度上緩解傳統依賴外部合作方進行OCR識別模型開發局面,可節約80%模型購置費用,降低新場景下的OCR模型研發成本。同時,平臺支持生成虛擬樣本,最少只需提供1張樣本即可生成虛擬數據樣本,多渠道響應缺樣本場景下OCR模型開發需求。

    二、縮短模型應用周期,提升對應用場景支撐效率。銀行業務單據憑證具有種類多、樣式更新快等特點,采用自訓練模式進行OCR識別模型開發,能夠迅速響應文檔格式內容更新后的OCR識別需求,在原模型基礎上進行增量訓練即可完成模型版本更新。通過自研模式開發應用OCR模型周期縮短至2周,配合關聯改造,訓練模型約4周即可投產使用,模型應用效率提升3倍以上,大幅度縮短新OCR模型研發周期。

    三、訓、管的統一管理,構建了一體化的管理及應用閉環。一是在模型訓練支撐的基礎上,OCR審單平臺建立將對行內各個OCR圖像識別模型進行統一管理,提供OCR模型調用統一出入口,并為所納管的識別模型提供試用及接口文檔更新儲存模塊,便于業務人員和技術人員進行效果評估與開發對接,實現模型集約化管理和簡易復用的應用效果。二是平臺支持數據回流,通過場景應用實踐,不斷回流數據至訓練平臺,形成訓練及數據閉環,不斷提升模型識別率。三是OCR審單平臺提供可視化實時監控界面對模型運行情況進行跟蹤,分析模型識別效果,模型管理人員通過界面及時掌握模型運行情況。

    四、貼合場景應用的平臺服務,高效響應了業務場景的應用。OCR審單平臺內置可視化配置規則集模塊,提供界面便于用戶以可視化配置的操作完成識別結果初步邏輯處理,通過系統進行規則判斷可替代識別結果簡單人工校驗比對工作,由純人工核驗模式轉化為人工復核模式,減少了簡單重復工作流程中的人力投入,同時提高了識別結果應用的精確性,信息錄入及使用效率提升300%以上,拓展OCR能力在各應用場景的深度應用。

    項目牽頭人

    粟尉廷 數字金融管理部總經理

    項目團隊成員

    周鋒、姜雄飛、謝彥、郭健、肖卓、黃丹、楊維、韋韻、黎雯雯

    責任編輯:王煊

    免責聲明:

    中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。

    為你推薦

    收藏成功

    確定
    芭乐视频网页版在线观看,中国gay粉嫩小帅fuck,一本久道视频无线视频,中国vpswindows野外农民工,未满十八禁止看1000部拍拍拍