7.非結(jié)構(gòu)化數(shù)據(jù)的生命周期管理
對于結(jié)構(gòu)化數(shù)據(jù),主要是針對表中的記錄進(jìn)行清理、歸檔或者銷毀,即每條數(shù)據(jù)記錄都有一定的生命周期。而非結(jié)構(gòu)化數(shù)據(jù)則類似于影像、文檔等,均是一個個獨(dú)立對象,因此其生命周期相比于結(jié)構(gòu)化數(shù)據(jù)存在較大的差異。一般來說,商業(yè)銀行會根據(jù)數(shù)據(jù)的類別、特點(diǎn)、屬性等相關(guān)信息來確定其生命周期。例如,商業(yè)銀行將數(shù)據(jù)進(jìn)行分類,不同類型的數(shù)據(jù)根據(jù)版本號、狀態(tài)、訪問時間來確定不同類型數(shù)據(jù)的生命周期管理策略。商業(yè)銀行可以將數(shù)據(jù)分成資訊數(shù)據(jù)、規(guī)章制度、辦公文檔、培訓(xùn)視頻、宣傳影像、論壇數(shù)據(jù)等各種類型,然后根據(jù)不同類型的數(shù)據(jù)特性,例如規(guī)章制度的版本、論壇帖子的最后訪問日期等進(jìn)行生命周期的制定。
舉個例子,表8-3為某商業(yè)銀行非結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)類型與保存期限。
1)對于規(guī)章制度等具有版本屬性的非結(jié)構(gòu)化數(shù)據(jù),當(dāng)前版本一直保留,上一版本超過保存期限后需要?dú)w檔并清理。
2)對于具有狀態(tài)屬性的非結(jié)構(gòu)化數(shù)據(jù),無效或超過保存期限后需要?dú)w檔并清理。
3)對于具有最后訪問日期屬性的非結(jié)構(gòu)化數(shù)據(jù),超過保存期限無訪問的數(shù)據(jù)需要?dú)w檔并清理。
4)無以上屬性的非結(jié)構(gòu)化數(shù)據(jù),從數(shù)據(jù)生成之日起開始計算保留時間,超過保存期限后需要?dú)w檔并清理。
當(dāng)然,這里僅僅是舉例說明,對于不同的商業(yè)銀行,其做法可能稍有差異,具體的非結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)生命周期管理策略還應(yīng)綜合考慮業(yè)務(wù)對非結(jié)構(gòu)化數(shù)據(jù)的在線時間需求、應(yīng)用服務(wù)器的存儲壓力、業(yè)務(wù)系統(tǒng)的活動情況等來綜合制定。