案例名稱
九章云極DataCanvas助力某銀行構建開源算法平臺
案例簡介
在實現金融科技智能化戰略的過程中,某銀行構建了各類AI能力,如NLP、OCR、語音識別等,但也隨之出現了一些問題,包括:平臺算法黑盒、基礎算力資源管理分散、缺少統一的模型部署管理平臺來納管異構模型。在本項目中,基于開源組件和白盒算子庫搭建企業級開源算法開發平臺。為全行分析及建模人員提供“練兵場”,為自研、創新提供孵化環境,支持多種常用的開源框架模型的統一納管和發布?;谛袃萲8s部署平臺,將訓練環境和預估環境隔離,實現計算資源統一管理、GPU/CPU的統一調度,同時實現了AI應用的統一監控。
創新技術/模式應用
搭建開源算法平臺:開源算法是銀行數字化轉型的重要工具,可以提高技術創新能力,降低研發成本,提高數據處理和分析能力,增強自主可控能力。但是開源算法在使用中會碰到很多問題,例如算法質量問題,由于開源算法的開放性,任何人都可以對其進行修改和補充,因此算法的質量參差不齊,有些可能存在缺陷或漏洞;維護和更新問題,開源算法的代碼是公開的,但是銀行在使用過程中仍然需要進行一定的維護和更新,這需要一定的技術支持和人力成本。本次項目,通過搭建開源算法平臺,使得銀行更加安全、高效地使用開源算法。開源算法平臺提供的主要能力有:
統一的開源算法庫
銀行需要根據實際業務需求選擇適用的開源算法,需要考慮算法的性能、可擴展性、開發難度、文檔資料豐富程度等因素,平臺根據行方的應用場景需求,對現在比較成熟和廣泛使用的算法框架,例如Scikit-learn、TensorFlow、Keras、PyTorch等進行了二次開發和優化,實現了不同框架算法的統一納管和發布,使得行方的調用更加高效。
開源算法統一調度
平臺實現了多算法框架的統一編排調度,解決了不同算法框架的接口兼容、分布式計算、資源管理和運行環境等多個方面的問題,實現了內存、GPU、CPU等計算資源的統一管理和調度,實現更加高效和準確的數據分析和機器學習。
自動化測試和部署
模型的測試和部署是制約應用場景落地的重要因素,平臺實現了開源算法模型的自動化測試和部署,集成測試框架,能夠實現模型的快速驗證;使用容器化技術,將模型文件和依賴自動打包成一個鏡像,實現自動部署,并持續監控與優化,能夠跟蹤算法模型的精度、速度和可靠性等指標,使得建模人員能夠根據監控數據進行調整和優化。
項目效果評估
銀行業務需要大量的數據分析和機器學習來實現風險控制、客戶營銷、業務決策等目標。通過使用開源算法平臺,銀行可以實現多算法框架的統一編排調度,從而提高數據分析和機器學習的效率,減少冗余工作和人工錯誤,提高數據分析和機器學習的準確性。在項目期間,平臺快速響應各業務的創新需求,實現了各種業務場景:
鄰近網點識別
為進一步提升客戶服務體驗,需根據客戶已留存的地址數據信息,實現對于每位客戶與其最近網點之間的匹配,并將結果落實成數據標簽。后續通過數據應用為客戶提供更為貼心的網點服務及更加精準的產品營銷,從而提升客戶網點到店率及交易活躍度。
數據自動化對標
對數據管理系統中數據標準對標管理流程優化,通過NLP技術輔助業務在數管系統中進行數據對標,減輕業務對標工作量。
事件知識庫
目前數據中心的知識庫主要以手冊形式,包括故障處理手冊、系統排查手冊等。但隨著行方業務的持續增長,以及信息系統的持續上線,以手冊保存數據中心知識的形式已不滿足當下的需求。行方急需建設一個輕流程的通過事件自動獲取知識的能力,通過NLP模型自動獲取有效的知識,并通過評價體系來實現知識的更新迭代,持續的提升數據中心知識庫建設的能力。
信用卡智能批額
通過接入客戶的內外部數據,例如客戶的個人信息、歷史信用卡使用記錄、個人財務狀況、征信數據等,構建信用卡額度智能決策模型,實現信用卡額度的自動審批,在符合風控要求的基礎上,提高用戶體驗。
開源算法平臺全面賦能行內的智能化場景,通過開源算法平臺,行方降低開源算法的使用運維成本、提高創新能力、增強靈活性和可定制性、提高安全性和可靠性,同時也促進了合作與共享,推進了銀行金融科技智能化戰略的進程。
項目牽頭人
王申 銀行BU總經理
責任編輯:陳愛
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。