銀聯商務OCR文字識別平臺項目
案例簡介
銀聯商務引入譯圖智訊OCR智能識別平臺及多項核心識別能力,并作為“銀商大腦2.0”的核心之一,實現了對文檔、票據、卡證的關鍵信息自動識別錄入,為商戶服務、智慧城市建設、普惠金融等領域提供了數智化識別解決方案。
譯圖智訊與銀聯商務深度合作,打造了自主可控的文字識別能力基石,滿足了“新支付”中各業務場景的定制化、多元化需求,使企業針對新場景新需求也具備快速響應文字識別能力,助力企業業務釋放勞動力,降低風險。
創新技術/模式應用
創新模式:
銀聯商務文字識別項目應用的文字識別平臺,集OCR識別、NLP自然語言處理、深度學習、智能文檔處理等多項核心技術研發,是多種識別模塊于一體、可自主進行模型管控的識別平臺,包含文檔通用識別、表格識別、卡證識別、票據識別等全品類識別產品,其識別服務具有多場景、多應用、多部署方式、高精度、高速度、高穩定性的特點與優勢。
通過提供管控平臺、模型推理端源碼,企業可根據模型結構、推理過程及其它功能,實現OCR識別模型的自主可控,研發屬于自己的OCR識別能力,并共同進行技術創新,探索OCR識別的更多可能性。
創新技術:
譯圖智訊OCR識別平臺深度學習技術的應用,使OCR識別性能得到了跨越式的升級。深度學習OCR借助神經網絡可模仿人腦機制對圖像、文本等數據進行分析,更加可靠、快速地完成海量樣本的訓練,得到近似專家能力的最優模型,同時在低質量圖像、生僻字、非均勻背景、多語言混合等復雜場景中實現了高效精準的識別與分類。
NLP智能提取技術的研發,實現了文檔圖像的關鍵信息分析和提取,可自動從非結構化信息中提取目標數據,可滿足所有文本的關鍵信息提取需求。通過模型管控,企業可通過少量樣本,高效完成模型的標注訓練,自定義創建提取模型。
通過不斷技術創新,譯圖智訊OCR識別產品性能一直處于行業領先地位,識別率高于99%,識別平均耗時低于200ms,并可針對證件更新進行快速響應推出新產品。
銀聯商務部署OCR識別平臺之后,一方面可以整合資源,向總公司各部門、各分支機構,以及外部合作單位,提供公有云接口輸出或者本地化部署服務;另一方面可以助力金融業務辦理流程的降本增速,提升業務能力,提高客戶體驗感。
項目效果評估
業務痛點:在財務報銷、商戶入網、遠程開戶、用戶注冊等場景中,存在海量的卡證、票據、表單、合同需要審核,這些紙質資料易丟失、損壞,不易保存和傳遞,在傳統管理方式中,企業一方面采用人工錄入的方式進行信息審核、存檔、業務辦理,但因內容較多、需錄入字段繁雜,并且常含有表格、印章等復雜因素,還要面對模糊不清、光斑折痕、傾斜旋轉等低質量圖片,人工操作面臨著耗時長、易出錯、風險高、成本高的問題;一方面使用圖片的形式進行存儲,導致系統里都是非結構化文檔,無法檢索并且不易傳遞,對后續的相關工作造成諸多不便。
解決方案:引用OCR識別平臺后,通過計算機代替人工操作,實現了全票據、人證、車證、企業證件、各類文檔的信息自動識別、自動分類、自動錄入,可將紙質文件的數據信息轉換成計算機可編輯的結構化數據,工作人員只需上傳文件即可實現一鍵識別、一鍵錄入、一鍵分類,節省了95%以上的工作量。針對關鍵字段審核難題,也可通過關鍵點的標注訓練,進行關鍵詞的提取審閱和系統錄入,真正做到對文檔憑證的高效管理,提高了業務辦理流程的電子化、數據化能力,使得用戶業務辦理更便捷、更安全、更高效,節省的人力時間成本可創造更多價值。
效果數據:應用OCR文字識別平臺代替人工操作后,一秒鐘可完成三張卡證的識別審核,單頁文檔識別只需要2-3秒,業務辦理審核效率提升幾十倍,新商戶入網達200多萬家。如今,銀聯商務布設的百萬級海量終端已全面擁抱互聯網,實體服務網絡覆蓋中國大陸所有地級以上城市及港澳地區,并拓展至96%的縣域,在線上和線下的支付場景中形成了完整的服務能力。
項目牽頭人
陶堅堅 項目經理
責任編輯:王煊
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。