首頁/ 科技/ 正文

銀行隱私計算平臺建設思考及技術選型建議

銀行隱私計算平臺建設思考及技術選型建議

隨著數字經濟的深入發展,資料作為關鍵生產要素的作用逐漸凸顯;同時,《資料安全法》和《個人資訊保護法》等法律法規的頒佈實施,對資料安全和隱私保護也提出更高要求。隱私計算是保護資料特定使用權跨界流通應用的新興技術,可以在密文狀態下完成規則及模型的計算,保護資料和隱私的安全。商業銀行一直是資訊化的引領者,同時也是資料密集型行業,目前隱私計算技術在商業銀行的落地應用趨勢已越來越明確。

商業銀行資料流通的需求及特點

對商業銀行來說,資料的作用集中體現在業務風控(生產過程,包括交易風控和信貸風控)和精準營銷(流透過程)。目前銀行資料跨界應用存在以下特點:

1、依賴外部資料進行業務風控和精準營銷

銀行業務依賴大量的內外部資料,自有內部資料有很高的金融價值屬性,並引入如運營商、司法、稅務等外部資料提升風控和營銷的效果。2021年7月央行要求實現個人資訊“斷直連”,應考慮透過徵信公司間接接入資料來源。

銀行資料向外流通的場景較為有限,主要流向關聯方或服務供應商。應考慮在不影響業務的前提下使用隱私計算技術保護輸出的資料。

2、演算法和模型要滿足安全性和可解釋性的要求

銀行使用資料主要用於自動化決策,自動化決策需要模型的支援,模型分為人工定義模型和機器學習模型。法律法規(《個人資訊保護法》明確要求自動化決策結果對個人權益有重大影響時要能說明清楚原因)、監管機構、消費者權益保護及自身風控等對演算法和模型的安全性及可解釋性提出要求。2021年3月央行釋出並實施《人工智慧演算法金融應用評價規範》,要求應用AI演算法需滿足安全性和可解釋性的要求。

3、多資料來源應用要求標準規範及產品技術上的互聯互通

資料跨界天然要求互聯互通,銀行多資料來源的特點導致銀行對標準規範和產品技術互聯互通的訴求更為強烈,整體互通包括節點互通、管理互通和演算法互通。隱私計算由於技術難度及場景適應性等原因,互聯互通的難度和節奏都不一樣,應該分開考慮,區別對待。

隱私計算的技術路線及發展趨勢

根據現有市場分類,隱私計算主要分為基於密碼學的多方安全計算(MPC)、基於可信硬體(TEE)的機密計算(CC)和聯邦學習(FL)三個技術方向。基於可信硬體的機密計算方案需要依賴國外的硬體裝置,存在重大安全隱患,有悖於“信創”的國家網路安全戰略,因此在國內屬於非主流方向;聯邦學習的主要目標是融合MPC、TEE、AI及傳統密碼技術,訓練更好的AI模型,為了提高效率,部分方案安全證明不嚴格,受到一定質疑;多方安全計算有嚴格的理論基礎且圖靈完備,有廣泛的應用空間,執行效能成為詬病的主要因素。

隱私計算是計算理論、資訊理論、密碼學等學科的綜合應用,相關技術不斷快速發展變化,具體來說有以下現象和發展趨勢:

1、多方安全計算理論和技術不斷髮展

多方安全計算適應各種計算任務。近年來,秘密分享、混淆電路等通用技術以及隱私交集、匿蹤查詢等專用技術的最佳化演算法和加速方案不斷迭代,滿足多種場景的商用需求。同時惡意模型、隱私度量、可驗證計算等新技術在快速發展,未來更好支援資料要素跨界流通,實現最小化資訊損耗,最大化資料價值。

2、開源的聯邦學習專案逐步成熟

機器學習的目標函式(損失函式、梯度演算法)比多方安全計算(任意計算)簡單,但計算過程和輪次複雜。聯邦學習解決機器學習的隱私保護問題,分為橫向、縱向和遷移,橫向是裝置聯邦,縱向是機構聯邦,銀行應用以縱向聯邦為主。聯邦學習開源框架已比較成熟並逐漸形成主流,相關技術門檻會逐漸降低,大型商業銀行應考慮在成熟框架上自研,從聯合開發起步,長期支撐業務發展。

3、國產TEE技術成熟尚需時日

TEE技術雖然在效能上有優勢,但由於成熟產品以國外廠商為主,國內TEE技術還在發展過程中,需持續跟進觀察。

商業銀行隱私計算平臺建設建議

近年來商業銀行開始隱私計算技術的佈局和研究,部分銀行著手試驗性的隱私計算平臺建設,關注重點各不相同。銀行隱私計算技術佈局建議如下:

1、從實際應用場景出發,兼顧多方安全計算和聯邦學習並快速落地

隱私計算技術在不斷髮展過程中,希望一個技術、一個平臺、一勞永逸解決所有問題是不現實的。多方安全計算通用性更好,而聯邦學習處理非結構化的資料更有效,銀行的重點是業務,應堅持實際業務場景出發,多方安全計算和聯邦學習並重,更靈活的適應各種業務場景。

2、選擇合適聯邦學習框架,合作開發並逐步開始自研和互聯互通建設

聯邦學習開源框架已比較成熟,銀行可根據自身業務需求選擇合適的框架,跟合作伙伴聯合開發快速落地,並逐步配備相關資源自研。伴隨聯邦學習框架集中度不斷提高,互聯互通的難度會越來越低。

3、與技術實力強的廠商合作,不斷應用多方安全計算及相關技術

多方安全計算的技術壁壘高,技術縱深大,一些關鍵的技術,如全同態密碼、惡意模型、可驗證計算、不可區分混淆等技術均在快速發展中,銀行應選擇在技術實力強的廠商長期深度合作。

4、考慮外部資料來源接入的效率和維護成本

商業銀行擁有強大的科技和運維團隊,外部資料來源不一定具備同等能力,如何實現快速接入,如何降低開發運維成本是需要重點考慮的問題。銀行自身隱私計算平臺可考慮集中建設,數量眾多的外部資料來源應採用互聯互通、方便維護的硬體一體化產品,降低開發、部署、接入和運維難度。

商業銀行隱私計算技術選型建議

選擇合適的合作伙伴是銀行隱私計算技術落地的關鍵點之一。隱私計算作為密碼安全技術且面臨各種各樣的應用場景,對密碼、安全以及業務要有深入理解,選擇有金融行業服務經驗的廠商和團隊至關重要。具體來說,可考慮以下要點來甄選廠商:

1、計算框架、整體安全及選型測試方案

隱私計算產品首先是一個安全產品,不能忽視整體安全功能,包括金鑰管理、訪問控制、接入鑑權、通訊安全、系統安全等。應優先選擇具有長期的銀行相關安全產品服務經驗的合作伙伴,廠商應具備質量體系、資訊保安管理體系等安全認證,產品應經過公安、國測等權威第三方安全檢測機構測試和認證。

隱私計算效能開銷包括計算、通訊和互動輪次開銷,通常提及計算和通訊開銷,對互動輪次開銷關注較少。前者可透過增加計算資源和通訊頻寬等緩解,互動輪次的開銷是不可解的。銀行風控等業務有實時性響應要求,並且資料來源多透過廣域網連線,互動輪次對響應時間影響更加突出,在區域網測試表現很好的方案和產品不一定實際可用。因此選型測試方案和測試環境應充分考慮上述因素。

2、基本隱私運算元原理及選型要點

由於混淆電路、秘密分享、同態密碼等通用隱私計算技術是從電路層面解決問題,因此基本隱私運算元主要包括加法(位元即異或門)、乘法(位元即與門)和比較(相當於電路中高低電平狀態判斷),對基本運算元要考慮:

①演算法原理安全論證:安全性有問題,效能再好也是沒有意義的;

②運算元安全靈活組合:單個運算元是無法保護隱私資訊;運算元安全組合(即由電路門組合成計算電路)可達到除結果外不洩露中間資訊的目標。基本運算元輸出支援密文狀態(分片或加密)才能實現安全組合;運算元組合有三種結構:順序、選擇和迴圈,應有安全合理的方案支援上述組合;

③正確性、精度和效能:選型需關注計算結果正確性和計算精度,不同精度對效能影響是不一樣的。

3、專用隱私運算元原理及選型要點

專用隱私運算元主要包括隱私交集、匿蹤查詢和不經意傳輸。每種專用運算元也都有多種不同的理論及演算法,依賴不同計算環境,測試注意事項及要點具體如下:

①隱私交集(PSI):隱私交集實現包括Hash、DH、OT等方案,可設定多種場景,在安全性和正確性的基礎上,比較效能(包括CPU、記憶體、頻寬和互動輪次)和靈活性(是否支援多種輸出方式和運算元組合);

②匿蹤查詢(PIR):匿蹤查詢分為保護資料方和不保護資料方兩類方案,應考慮安全性、是否預處理、是否分桶等因素,設計不同測試場景和用例;

③不經意傳輸(OT):不經意傳輸是高階運算元的基礎,也有多種不同理論和演算法,設定2選1、多選1等用例,在安全性論證基礎上,比較效能和靈活性。

4、聯邦學習演算法原理及選型要點

聯邦學習需要考慮訓練階段、模型類別、縱向橫向等支援,互聯互通也是重要關注點。相關測試注意事項及要點具體如下:

①演算法原理論證:安全基礎不同,功能、效能不具有可比性,應該對演算法原理進行論證和驗證;

②縱向聯邦和橫向聯邦:橫向聯邦相對容易實現,但銀行應用場景更多是縱向,應重點關注縱向聯邦;

③特徵工程:樣本對齊、特徵篩選等需要隱私保護,因此也應關注;

④模型支援:目前常用模型有迴歸類模型、決策樹模型、神經網路模型等,隱私保護下,迴歸類和決策樹可以商用,深度神經網路效能一般,建議目前重點考慮縱向迴歸類和縱向決策樹模型;

⑤互聯互通:國內FATE影響力比較大,可以考慮與FATE的互聯互通測試。

5、專家規則演算法原理及選型要點

銀行業務對專家規則的依賴比較高,專家規則可能是多種多樣的,需要多方安全計算支援,同時風控類業務對實時響應的要求又比較高,既需要考慮各種規則的隱私度量,又需要考慮如何根據目標函式、資料特點、部署環境、網路環境和響應時間要求等採用運算元組合來實現,還需要考慮運算元組合的安全性及如何靈活組合以快速支援業務開發,測試注意事項及要點具體如下:

①隱私度量預算:資料方和使用方都會擔心自身的模型及資料洩露,而隱私計算的理論決定了必然有隱私損耗,因此計算雙方需要做好隱私預算,同時在模型設計、計算中進行隱私度量和預算控制,防範惡意合作方竊取隱私資料;

②隱私規則引擎:應支援圖形化的、靈活簡潔的隱私專家規則設計,設計過程可展示度量資訊損耗、度量計算、通訊開銷和響應時間。

6、預研類技術前瞻佈局

多方安全計算和聯邦學習技術在快速發展變化中,比如新一代的全同態密碼及演算法加速、惡意模型、可驗證計算、屬性加密和訪問控制、函式加密、不可區分混淆,這些技術將是隱私計算下一步的發展方向,也將進一步推動資料安全和隱私保護的發展。銀行應該選擇在上述技術上有考慮有佈局的合作伙伴,以保持銀行在隱私計算和資料流通上的領先優勢。

作者簡介:劉偉,中科院軟體所軟體與理論專業博士,從事密碼和資訊保安工作二十餘年,專注隱私保護和資料安全方向,熟悉銀行金融科技,對智慧風控、大資料反欺詐等有深刻的理解和豐富的經驗。

相關文章

頂部