大數(shù)據(jù)正成為繼云計算、物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)之后又一個被熱議、熱捧的概念。在將大數(shù)據(jù)作為信息技術未來發(fā)展方向和經(jīng)濟社會諸行業(yè)領域應用方向予以關注的同時,也必須對大數(shù)據(jù)有全面、清醒的認識,才能充分發(fā)揮大數(shù)據(jù)的應用價值。

  一是要全面認識大數(shù)據(jù)的內(nèi)涵,避免陷入單純的計算能力和存儲能力建設

  雖然“大數(shù)據(jù)”本指“規(guī)模很大的數(shù)據(jù)(集合)”,但總體上應是數(shù)據(jù)、技術與應用三者的統(tǒng)一。從對象角度看,大數(shù)據(jù)是大小超出典型數(shù)據(jù)庫軟件采集、儲存、管理和分析等能力的數(shù)據(jù)集合,這是大數(shù)據(jù)分析的對象,不以之為基礎,大數(shù)據(jù)分析與利用就無從談起。同時,大數(shù)據(jù)并非大量數(shù)據(jù)簡單、無意義的存儲與堆積,數(shù)據(jù)間是否具有關聯(lián)性,是“大數(shù)據(jù)”與“大規(guī)模數(shù)據(jù)”的重要差別,也是大數(shù)據(jù)能夠得以應用的基礎。從技術角度看,大數(shù)據(jù)技術是從各種各樣類型的大數(shù)據(jù)中,快速獲得有價值信息的技術及其集成,這種對數(shù)據(jù)對象的動態(tài)處理行為是“大數(shù)據(jù)”與“大規(guī)模數(shù)據(jù)”、“海量數(shù)據(jù)”等類似概念間的最大區(qū)別。這其中,大數(shù)據(jù)技術是使大數(shù)據(jù)中所蘊含的價值得以發(fā)掘和展現(xiàn)的重要工具。從應用角度看,大數(shù)據(jù)是對特定的大數(shù)據(jù)集合,集成應用大數(shù)據(jù)技術,獲得有價值信息的行為。大數(shù)據(jù)所以成為熱點,就在于各個行業(yè)領域具有了對大數(shù)據(jù)分析和利用的巨大現(xiàn)實需求和具體應用需求。如果不與具體應用相聯(lián)系,大數(shù)據(jù)的作用和價值就無從談起。同時,不同領域、不同企業(yè)、不同業(yè)務的數(shù)據(jù)集合和分析挖掘目標存在差異,所運用的大數(shù)據(jù)技術和大數(shù)據(jù)分析處理系統(tǒng)也可能存在相當大不同。正由于與具體應用緊密聯(lián)系,甚至是一對一的聯(lián)系,才使“應用”成為大數(shù)據(jù)不可或缺的內(nèi)涵之一??梢?,只有全面認識并堅持“數(shù)據(jù)、技術、應用”三位一體共同發(fā)展,所發(fā)展的才是真正的大數(shù)據(jù)。若只是加強基礎設施建設,只是將很多數(shù)據(jù)存儲起來,可能連大數(shù)據(jù)的皮毛都難以摸到。

  二是要清醒認識大數(shù)據(jù)發(fā)展的成熟度,避免過度建設下的目標落空

  在多方的擂鼓助威下,投身大數(shù)據(jù)研發(fā)與應用已成為新的熱潮,其廣泛應用和巨大收益似乎觸手可及。但大數(shù)據(jù)畢竟是由商業(yè)機構率先提出并加以推進的概念,為了在軟硬件產(chǎn)品和信息服務方面獲得更多收益,跨國信息技術企業(yè)在推廣大數(shù)據(jù)概念的過程中也難免包含炒作的成分。若不加分辨,盲目跟隨,很可能會起大早、趕晚集,甚至趕錯集。

  全球大數(shù)據(jù)的發(fā)展還處于起始階段,理論展望尚多于實踐探索。特別要注意到的是,與藉成熟技術積累推動應用模式創(chuàng)新的云計算、物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)等領域不同,大數(shù)據(jù)領域的技術尚未完全成熟,在多源異構信息融合、大規(guī)模數(shù)據(jù)智能清洗、大規(guī)模異構數(shù)據(jù)并行挖掘、大規(guī)模異構數(shù)據(jù)在線分析處理、大規(guī)模數(shù)據(jù)可視化等技術領域還需要做大量研究創(chuàng)新工作,尤其是決定大數(shù)據(jù)應用能力高低的人工智能技術尚未取得革命性突破,將在一定時間內(nèi)限制大數(shù)據(jù)的深度應用。這種背景下,對大數(shù)據(jù)的發(fā)展必須從基礎做起,注重核心關鍵技術創(chuàng)新與應用模式創(chuàng)新的協(xié)同并進;對大數(shù)據(jù)的應用必須考慮技術實現(xiàn)能力,避免目標過于理想,難以落地。

  三是要客觀分析用戶自身的應用基礎和應用目標,避免多做無用功

  大數(shù)據(jù)應用可以分為多個層次,例如,對大規(guī)模數(shù)據(jù)的初步加工整理、運用已有知識規(guī)則對大數(shù)據(jù)信息的分析發(fā)掘,運用人工智能工具自動發(fā)現(xiàn)新的知識規(guī)則并挖掘新的關聯(lián)信息等。從廣義上看,這些都可以歸屬于大數(shù)據(jù)層次;從實際看,不同的企業(yè)、相同企業(yè)在不同應用階段,在大數(shù)據(jù)應用方面也確實有著不同的應用要求。因此,在運用大數(shù)據(jù)時,必須與用戶自身實際情況相結(jié)合。同時,在系統(tǒng)頂層設計時,采用開放可擴展的體系結(jié)構,以便在未來功能需求增多增強時實現(xiàn)快速、靈活的升級。

責任編輯:admin