大數據被區(qū)塊鏈撞了一下腰
區(qū)塊鏈和大數據都是熱門的話題,很多人把他們放在一起討論,希望能碰撞出更多的熱點。大數據發(fā)展早于區(qū)塊鏈,目前已經成為一個龐大的產業(yè)。而區(qū)塊鏈處在產業(yè)的初期,很多技術和商業(yè)模式還在探索之中。
鑒于大數據產業(yè)相對比較成熟,我們以大數據為出發(fā)點,來看一下區(qū)塊鏈技術如何與大數據產業(yè)的各個環(huán)節(jié)進行對接。

大數據核心產業(yè)鏈條可以大致分為以下三部分:
產品部分:包括大數據基礎軟件、大數據應用軟件等大數據軟件產品相關產業(yè)。
數據部分:包括數據源(數據采集、數據提供)、數據流通(數據交易、數據共享)等與數據直接相關的產業(yè)。
服務部分:包括大數據基礎設施服務(數據存儲、數據傳輸、數據清洗、數據脫敏等)、大數據分析服務以及大數據應用服務等服務類相關產業(yè)。
01產品部分
軟件產品和區(qū)塊鏈的結合,其結合點應該是在技術方面。大數據技術與區(qū)塊鏈技術中有相似點:都是分布式架構。
然而他們又有很明顯的不同點:大數據技術中使用分布式技術是為了計算資源——利用多臺機器的計算資源,將單機無法處理完成的任務,分配給多臺計算機完成,每臺計算機通過處理不同的任務,整合多臺計算資源,形成強大的數據處理能力。
而區(qū)塊鏈使用分布式技術是為了讓多個主體能夠相互信任——每個主體通過自己控制的計算機參與到整個區(qū)塊鏈的運行中,每臺計算機運行的任務基本相同,整個區(qū)塊鏈通過大量重復冗余的計算,實現多主體之間的相互信任。
從技術角度看,大數據技術用信任換取了計算資源,而區(qū)塊鏈技術用計算資源換取了信任。由于兩者之間的這種區(qū)別,在技術上,大數據和區(qū)塊鏈很難找到合適的碰撞點。
02數據部分
在數據部分的多種業(yè)態(tài)中,區(qū)塊鏈都能找到其用武之地。
數據源:如果數據是由單個主體所采集收集的,不涉及到信任問題,引入區(qū)塊鏈的意義不大。但如果涉及到多個主體進行數據采集、提供數據的情況,區(qū)塊鏈就可以發(fā)揮它的作用了。
為了解決多主體之間的信任問題,每個主體都將自己采集到的數據廣播給所有使用方,并將數據的Hash值保存在區(qū)塊鏈上。區(qū)塊鏈上的每個主體都可以根據區(qū)塊鏈上的Hash值,驗證自己收到的完整數據是否被篡改。區(qū)塊鏈的可追溯性和防抵賴性,讓多方提供數據時更加可信。同時,這種方式也有助于維護大數據的完整性。
而在數據流通行業(yè),區(qū)塊鏈能起到的作用就更大了。在大數據流通行業(yè)中,大數據本身就是一種數字資產。數字資產的交易,可以通過區(qū)塊鏈實現。并且,在區(qū)塊鏈上實現的去中心化大數據交易,可以減少原始數據的接觸者。在一個去中心化的交易平臺上,只有買賣雙方可以接觸到原始數據;而在中心化的交易平臺上,作為交易中心的數據中介通常也會接觸到原始數據,這就增加了數據泄露、資產損失的風險。
03服務部分
在大數據服務中,服務能力作為一種數字資產,與數據交易中的數據即為資產的理念是一樣的,都可以進行交易。
而區(qū)塊鏈在這種數字資產的交易中,就能夠發(fā)揮重要的作用。同時,近期又有很多新的技術在不斷改變著區(qū)塊鏈,例如同態(tài)加密技術。同態(tài)加密是區(qū)塊鏈與大數據服務結合的一個重要技術點,同態(tài)加密能夠真正實現將數據的服務能力轉化為數字資產,同時又不會有服務中原始數據被大數據服務商拷貝的風險。
綜上所述,區(qū)塊鏈與大數據還是有很多碰撞點的。本文只是分析了用區(qū)塊鏈技術去碰大數據產業(yè)的情況,而用大數據技術碰區(qū)塊鏈產業(yè),也同樣有大量的熱點,我們在今后的文章中會討論到這個問題。
                                        
                                        
                                        
                                        
                                        


