,然后才正式的在您的生產環(huán)境運。
5、將對非結構化的內容的管理納入到您企業(yè)的數(shù)據(jù)管理能力
非結構化數(shù)據(jù)一直是企業(yè)業(yè)務運營的一部分,但既然現(xiàn)在我們已經(jīng)有了更好的技術來探索,分析和這些非結構化的內容,進而幫助改善業(yè)務流程和工業(yè)務洞察,所以我們最終將其正式納入我們的數(shù)據(jù)管理是非常重要的。大多數(shù)企業(yè)目前都被困在了這一步驟。
數(shù)據(jù)庫中基本的、非結構化的數(shù)據(jù)是以評論的形式或者自由的形式存在的,其至少是數(shù)據(jù)庫的一部分,應該被納入到數(shù)據(jù)管理。但挖掘這些數(shù)據(jù)信息則是非常難的。
數(shù)字數(shù)據(jù)存儲在傳統(tǒng)的結構化數(shù)據(jù)庫和業(yè)務流程外,很少有許多的治理范圍分組和數(shù)據(jù)管理的實現(xiàn),除了當其被看作是一個技術問題時。一般來說,除了嚴格遵守相關的安全政策,今天的企業(yè)尚未對其進行真正有效的管理。當您的企業(yè)開始大跨步實現(xiàn)了大數(shù)據(jù)項目之后,您會發(fā)現(xiàn)這一類型的數(shù)據(jù)信息迅速進入了您需要管理的范疇,其輸出會影響您企業(yè)的商業(yè)智能解決方案或者甚至是您企業(yè)的業(yè)務活動。積極的考慮將這些數(shù)據(jù)納入到您企業(yè)的數(shù)據(jù)管理功能的范圍,并明確企業(yè)的所有權,并記錄好這些數(shù)據(jù)信息的諸如如何使用、信息來源等等資料。
不要采取“容易的輕松路線”,單純依靠大數(shù)據(jù)技術是您企業(yè)唯一正式的非結構化數(shù)據(jù)管理的過程。隨著時間的推移,企業(yè)將收集越來越多的非結構化數(shù)據(jù),請務必搞清楚哪些數(shù)據(jù)是好的,哪些是壞的,他們分別來自何處,以及其使用是否一致,將變得越來越重要,甚至在其生命周期使用這個數(shù)據(jù)都是至關重要的。
要保持這種清晰,您可以使用大數(shù)據(jù)和其他工具,以了解您企業(yè)所收集的數(shù)據(jù)信息,確定其有怎樣的價值,需要怎樣的管理,這是至關重要的。隨著您的企業(yè)不斷的在您的業(yè)務流程中“發(fā)掘”出這一類型的數(shù)據(jù),其變得更加精確和有價值。其可能還具有額外的特點,符合安全,隱私或法律和法規(guī)的元素要求。
最終,這些數(shù)據(jù)塊可以成為新的數(shù)據(jù)元素或添加到現(xiàn)有的數(shù)據(jù),但您必須有元數(shù)據(jù)對其進行描述和管理,以便盡可能最有效地利用這些數(shù)據(jù)。大多數(shù)進入您企業(yè)大數(shù)據(jù)系統(tǒng)的非結構化數(shù)據(jù)都已經(jīng)經(jīng)過一些監(jiān)控了,但通常是作為一個BLOB二進制大對象和非結構化的形式進行的。