(4)數據存儲技術
數據存儲技術平臺的選擇一般要結合數據的重要等級、服務等級、安全等級、數據類型、數據訪問特性(增/刪/改/查)等多種因素綜合考慮。
1)對于交易型數據,由于屬于交易系統,重要且存在大量用戶的高并發訪問,要求實時響應并提供7×24h的服務,因此一般采用面向聯機事務處理系統(OLTP)的關系型數據庫來實現。從實際情況看,絕大多數銀行采用DB2及Oracle這兩種數據庫實現交易型數據的存儲。
2)對于集成型數據,該類數據主要服務于銀行的決策支持,其重要程度、服務等級相對較低,但其數據規模相對較大(一些大型銀行的集成型數據可達PB級),以后臺批量運算為主,所以一般采用大規模并行處理系統( MPP)架構的技術平臺進行數據的存儲管理,如IBM DBF、Teradata、Greenplum等。而隨著大數據時代的到來,數據呈現爆發式增長,而且出現了大量的文本、網頁、圖像等半結構化和非結構化類型的有分析價值的數據,與之相應各類技術平臺也雨后春筍般地涌現。目前,Hadoop、Spark是互聯網企業運用較多的技術,各銀行也在進行探索和引入,并在不同業務場景中獲得了初步的成功。
3)對于分析型數據,主要面向客戶關系管理、風險管理、績效管理等業務領域服務,側重于各類業務指標的計算和展現服務,具有批量計算、在線分析挖掘與即時響應等特點,一般采用Oracle、SAS類產品存儲,并與分析挖掘工具、可視化工具結合滿足用戶的數據分析挖掘需要。
4)對于歷史型數據,一般區分結構化數據與非結構化數據進行存儲技術平臺考慮。銀行的結構化歷史型數據主要以客戶的交易明細為主,需要滿足大量客戶的并發訪問需求,傳統是采用Oracle等關系型數據庫,采用分庫形式(如按歷史時間段)提供服務,隨著MPP類系統、Hadoop的查詢并發響應能力的提高,一些銀行已經采用此類系統進行歷史數據存儲,部分銀行正在進行技術可行性評估,逐步考慮遷移至該類系統提供服務,減少因分庫而帶來的架構及操作復雜性。銀行的非結構化歷史型數據包括電子影像文檔等。此類數據規模巨大,一般采用磁盤文件、光盤、數據庫(存放索引)等多種技術平臺實現該類數據的存儲與查詢訪問。