成都海擎科技有限公司
電話:028-65065822
郵箱:cdhaiqing@163.com
聯(lián)系人:袁女士
地址:成都市高新區(qū)天府三街69號
整合或分解:哪種方式使大數(shù)據(jù)策略立于不敗之地
大數(shù)據(jù)策略會失敗嗎?是時候該討論一下這個問題了。企業(yè)才剛剛掌握如何集成ERP(企業(yè)資源規(guī)劃)及其他業(yè)務(wù)應(yīng)用來消除業(yè)務(wù)流程中妨礙效率的孤島。面向服務(wù)架構(gòu)、軟件即服務(wù)、云計(jì)算及其他現(xiàn)代化解決方案在協(xié)助企業(yè)實(shí)現(xiàn)大型應(yīng)用集成過程中都發(fā)揮了一定的作用。但是如今,在大量數(shù)據(jù)的環(huán)境中組織正面臨新的一系列挑戰(zhàn)。更清楚地說,它不是一條數(shù)據(jù)流。它是由許多獨(dú)立的數(shù)據(jù)流組成的,使數(shù)據(jù)互相分離或者就像以前的企業(yè)應(yīng)用那樣將孤立起來。 這不是因循守舊 這些數(shù)據(jù)中有許多都不像那些企業(yè)用處理的數(shù)據(jù)那樣。在大規(guī)模結(jié)構(gòu)化數(shù)據(jù)環(huán)境中,數(shù)據(jù)激增所面臨的大部分挑戰(zhàn)都可以通過擴(kuò)展、冗余及分析而得到解決。大數(shù)據(jù)時代,以上這些挑戰(zhàn)僅僅是企業(yè)必須解決的小部分問題。如今收集到的數(shù)據(jù)類型來源非常廣泛。
數(shù)據(jù)通過嵌入式傳感器、RFID芯片、箱子和音像供給、文檔和圖像文件、圖像等其他方式而傳輸?shù)綌?shù)據(jù)庫中。社交媒體會改變數(shù)據(jù)應(yīng)有的形象。這還不包括業(yè)務(wù)伙伴之間所共享過的大數(shù)據(jù)。 組織不再描述或者規(guī)定數(shù)據(jù)所要展現(xiàn)的形式。
實(shí)際上,如果嘗試這樣做,會大大地降低數(shù)據(jù)本身的價(jià)值。企業(yè)僅能預(yù)測一定數(shù)量的潛在情節(jié)或者反應(yīng)。無論他們創(chuàng)建了多少復(fù)選框或者數(shù)據(jù)文件,總會有數(shù)據(jù)溢出的現(xiàn)象。從競爭的角度來說,忽視那些非傳統(tǒng)數(shù)據(jù)的后果是極具破壞性的。最近麥肯錫全球研究院進(jìn)行了一項(xiàng)研究,題目為:大數(shù)據(jù)是創(chuàng)新、競爭、生產(chǎn)率領(lǐng)域的下一個研究方向,研究表明如果企業(yè)未能充分利用現(xiàn)有的數(shù)據(jù),那么該企業(yè)將虧損數(shù)千億美元。 關(guān)系數(shù)據(jù)庫僅能提供部分解決方法 由于數(shù)據(jù)量大而且種類不同,因此采用工具和技術(shù)管理非結(jié)構(gòu)化數(shù)據(jù)就變得非常困難。
非關(guān)系型NoSQL、XML以及關(guān)鍵/數(shù)值數(shù)據(jù)存儲都可以協(xié)助企業(yè)解決多數(shù)大數(shù)據(jù)的可伸縮性和可訪問性問題。例如Hadoop這樣的解決方案使用MapReduce及Hive Query Language,為企業(yè)提供管理大數(shù)據(jù)的一個起點(diǎn),并獲取商業(yè)情報(bào)。
如MongoDB和Cassandra這樣的NoSQL數(shù)據(jù)庫管理系統(tǒng)已經(jīng)實(shí)現(xiàn)Hadoop集成,使客戶獲得至少一個客戶端接口或者覆蓋連接不同的數(shù)據(jù)流變得更加容易一些。 如今數(shù)據(jù)本身在企業(yè)中變得更加靈活。并行流程及智能數(shù)據(jù)將JitterBit這樣的工具分塊應(yīng)用,將其設(shè)計(jì)成允許數(shù)據(jù)從一個應(yīng)用程序傳輸?shù)较乱粋€應(yīng)用程序,并保證傳輸?shù)臄?shù)據(jù)質(zhì)量。這種通過數(shù)據(jù)類型及應(yīng)用進(jìn)行的集成對于時間敏感的企業(yè)活動來說非常重要,這些活動中也會涉及即時分析。一般地,這種形式的分析必須查詢當(dāng)前數(shù)據(jù)和歷史數(shù)據(jù),來識別新趨勢。這就是SQL經(jīng)常再次發(fā)揮作用的原因。