發展大數據產業——我國能否搶占先機?
大數據是指體量巨大、數據類型繁多、價值密度低、復用性強、實時性要求高的信息數量集。2008年,美國《自然》雜志首次提出大數據概念,引起了科技界和企業界關注。2012年3月,美國政府發布《大數據研究和發展計劃》。2012年7月,我國《“十二五”國家戰略性新興產業發展規劃》明確提出“加強以海量數據處理軟件等為代表的基礎軟件的開發”。大數據再次成為信息技術領域的熱點,其大規模運用必將帶動新一波生產效率的提高。海量數據正在對我們的統計手段及商業模式產生強烈的沖擊。針對這一產業態勢,國外IT巨頭在大數據領域有何部署,我國如何把握大數據產業潮流并搶占先機,本文將就這些問題做出探討。
一、 大數據豐富了統計方法并對商業模式及經濟效益產生影響
從2000年開始,世界的數據存儲發生了標志性的變化,數字形式的存儲方式占據了主流,從2000年的35%上升到2010年96%。麥肯錫咨詢報告也指出,美國所有領域的企業數據存儲量至少達到了100 T字節的數量級,并且多數部門已經超過了1P字節。依托云計算技術的大數據存儲、挖掘及分享手段豐富了人類認知的方法。
(一)依托大數據樣本空間能夠實施相關關系預測并彌補抽樣調查的不足
一是相關關系預測能夠準確完成。基于大數據的商業分析能夠建立在全部樣本空間上面,這可以使我們進行事物相關關系預測,而不必一定遵循因果關系的預測。由于能夠獲取事物的全部樣本空間,才使得相關關系預測變為可能。例如,谷歌流感趨勢預測模型中,計算機把檢索詞條在5億個模型進行測試之后,準確的找出了與流感最相關的詞條,從而預測冬季流感的傳播。二是大數據彌補抽樣調查手段的不足。由于抽樣調查抽取的隨機樣本容易受到主客觀因素的干擾,這導致了數據分析結果的真實性,基于“樣本空間=全部空間”的方法直接揭示了事物發展規律,可作為統計學方法的補充。
(二)大數據正在催生以數據資產為核心的多種商業模式
數據生成、存儲、分析、檢索、分享、消費構成了大數據的生態系統,每一環節產生了不同的需求,新的需求又驅動方法和技術創新。從大數據經濟效益的產生來源可以分為以下幾種模式。
1、大數據內生型價值模式
大數據價值產生于企業內部價值鏈,企業通過對從海量數據分析、檢索提取有價值的結論并服務于生產經營,最終產生內部經濟效應。無論企業借助于數據分析公司還是依靠自身完成分析,數據價值都是來自于企業內部價值鏈。例如,騰訊公司正在運用 “騰訊搜搜”的海量數據來分析用戶的興趣及行為,從而確定廣告的精準發放。
2、大數據外生型價值模式
數據資產作為企業的新富礦,擁有大數據資產的企業以出售、租賃的方式授權其他企業使用數據,從而把數據資產轉變為收入的源泉,例如,美國的twtter公司以授權的方式把企業的海量數據授權出售給其他企業使用來獲取收益。另一方面,擁有數據資產的企業也可對其他企業開放數據,間接獲得用戶訪問數據的收益,例如,國內大眾點評網以API形式開放數據端口,授權其他企業訪問商戶信息、用戶點評、優惠及團購信息,從而推動O2O產業鏈的完善和發展。
3、大數據寄生型價值模式
具備數據挖掘、分析技能的企業能夠利用大數據提供專業的咨詢服務,但這些企業本身不產生大數據。咨詢或數據分析公司是大數據生態系統專業化分工的產物,這些企業“寄生”在大數據領域,基于數據提供商業證析服務。例如,美國的天睿公司就是提供專業化數據分析的公司,本身不擁有數據,其服務的客戶包括沃爾瑪及Pop-Tarts公司。
4、大數據產品型價值模式
與大數據相關的軟件企業、硬件企業通過提供大數據存儲、分析、檢索相關的產品,獲得收入。這些企業既不產生大數據,也不依托大數據提供服務,而是提供解決大數據存儲、分析、檢索等問題的產品,包括硬件、軟件產品。例如,英特爾、IBM推出的大數據解決方案軟件產品。
5、大數據云計算服務型價值模式
企業依托云計算直接向用戶提供基于大數據生成、存儲、分析、檢索、分享、消費等服務的平臺。云計算為大數據提供彈性可擴展的基礎設施支撐環境。客戶無需安裝、運行軟硬件,直接將業務部署到云端,即可以獲得大數據處理能力。例如,亞馬遜推出面向用戶的公有云Elastic MapReduce服務、微軟的Azure云平臺Hadoop大數據分析服務。
二、 國外大數據的應用現狀及主要動向分析
(一)大數據已經深耕于經濟領域并創造了巨大的經濟價值
一是美國的大數據產業已經創造了巨大的經濟價值。大數據已經對美國健康醫療、公共管理、個人位置數據、零售業及制造業等五個部門產生重大的經濟影響。資料表明,在醫療領域每年產生3000億美元的潛在價值;在公共管理部門,每年產生2500億美元的潛在價值;在個人位置數據領域,每年產生1000億美元的市場;在零售業能夠增加60%的營業額;在制造業部門,能夠降低50%的產品開發及裝配成本。二是大數據在歐洲公共管理部門得到深入應用。大數據在OECD組織中的歐洲國家公共管理部門創造了1500到3000億歐元或更高的潛在經濟價值,這些經濟價值主要通過政府公共管理機構開支的減少、轉移支付的下降及稅收的增加來實現。三是全球大數據人才需求將上升并且出現供需缺口。Gartner咨詢公司預測,到2015年,大數據人才需求達到440萬人,人才需求缺口將達到三分之一。
(二)歐美等發達國家把數據資產上升到國家信息戰略高度
一是美國已經布局大數據產業。2012年3月,美國奧巴馬政府宣布投資2億美元啟動“大數據研究和發展計劃”,這是繼1993年美國宣布“信息高速公路”計劃后的又一次重大科技發展部署。美國政府認為大數據是“未來的新石油與礦產”,將“大數據研究”上升為國家意志,對未來的科技與經濟發展必將帶來深遠影響。二是歐盟及日韓將會緊隨其后。繼美國率先開啟大數據國家戰略先河之后,歐盟、日本及韓國等國家也將跟進,預計不久相應的戰略舉措也將出臺。數據規模及運用數據的能力將成為綜合國力的重要組成部分,對數據的占有和控制也將成為國家間爭奪的焦點。
三、 我國大數據產業應用現狀
在全球經濟、技術一體化的今天,我國IT行業已經開啟了大數據的起航之旅,大數據已經在經濟領域發揮重要作用。據計世咨訊預測,2012年,政府、互聯網、電信、金融等領域市場規模占據近一半的市場份額。大數據在主要經濟領域的應用現狀如下。
(一)大數據在經濟預警方面發揮重要作用
在2008年金融危機中,阿里平臺的海量交易記錄預測了經濟指數的下滑。2008年初,阿里巴巴平臺上整個買家詢盤數急劇下滑,預示了經濟危機的來臨。數以萬計的中小制造商及時獲得阿里巴巴的預警,為預防危機做好了準備。
(二)大數據分析成為市場營銷的重要手段
與傳統的市場研究方法不同,大數據的市場研究方法不再局限于抽樣調查,而是基于幾乎全樣本空間。例如,百度擁有中國最大的消費者行為數據庫,覆蓋95%的中國網民,搜索市場占比達87%。百度基于最真實的用戶行為數據和多維度研究工具,幫助寶潔精準的定位了消費者的地域分布、興趣愛好等信息,根據百度分析的結論,寶潔適時地調整了營銷策略。
(三)大數據在臨床診斷、遠程監控、藥品研發等領域發揮重要作用
我國目前已經有十余座城市開展了數字醫療。病歷、影像、遠程醫療等都會產生大量的數據并形成電子病歷及健康檔案。基于這些海量數據,醫院能夠精準地分析病人的體征、治療費用和療效數據,可避免過度及副作用較為明顯的治療,此外還可以利用這些數據進行實現計算機遠程監護,對慢性病進行管理等。
(四)大數據為金融領域的客戶管理、營銷管理及風險管理提供重要支撐
大數據能夠解決金融領域海量數據的存儲、查詢優化及聲音、影像等非結構化數據的處理。金融系統可以通過大數據分析平臺,導入客戶社交網絡、電子商務、終端媒體產生的數據,從而構建客戶視圖。依托大數據平臺可以進行客戶行為跟蹤、分析,進而獲取用戶的消費習慣、風險收益偏好等。針對用戶這些特性,銀行等金融部門能夠實施風險及營銷管理。
四、 發展大數據產業面臨的挑戰
大數據在開始應用的同時,也在基礎軟件研發、智慧城市建設、數據流動性等方面尚存在一些不足。
(一)我國大數據產業與世界發達國家基本處于同一起跑線上,但國家層面的戰略規劃引導及扶持有待加強
業界認為,上世紀80年代出現IBM電腦主機以及90年代出現個人電腦兩次IT浪潮,我國都處于被動跟隨狀態。以云計算為代表的第三次IT浪潮下,我國的大數據產業基本與全球處于同一起跑線上,同時,這也說明我國的大數據產業正處于產業初創期,急需政策的扶持,國家政策層面的大數據專項規劃仍未出臺。
(二)產業資本正在進入大數據領域,但占據大數據生態系統主導地位的領軍企業仍然缺乏
我國的大數據產業正在吸引資本的高度關注。雖然國內已經有多只產業資本注資大數據產業,但占據大數據生態系統主導地位的領軍企業仍然缺乏。做大數據產業不難,占據以核心軟件產品為主導地位的生態系統較難,尤其是開發分布式文件處理系統等基礎軟件的企業。
(三)零售、電商的部分數據已經開放,但行業間的數據流動性不足和數據獲取壁壘困擾業內企業發展
圍繞數據資產,我國零售、電商等部分企業數據已經具有一定的流動性。但與此同時,我國政府公共管理數據、社交平臺數據仍處于相對封鎖狀態,缺乏“流動性”和“可獲取性”。相比之下,2009年,美國政府創建了Data.gov網站[1],為大數據敞開了大門,公眾能夠通過這個網站獲得各種政府數據。我國要在保障信息安全的前提下公開數據。數據的開放及流通是順應時代與技術發展的大勢所趨,拒絕數據意味著拒絕財富。
(四)大數據在智慧城市領域的應用已初見端倪,但行業數據仍處于割裂狀態,深度挖掘數據價值的技術手段較為缺乏
智慧城市會催生大數據,大數據已經應用于我國智慧城市的物流、交通、電網、工業、農業、建筑、環境、醫療等方面。另一方面,智慧城市各個領域的數據關聯、集聚、共享、價值的深度挖掘目前還不夠,在數據計算、可視化、結果呈現等方面仍有很多技術問題亟需解決。
(五)圍繞大數據生態已經確立了多種商業模式,但還有更多的盈利方式有待探索
大數據產業已經明確了一些盈利手段及商業模式,但就商業模式而言還有很多的盈利手段沒有創新出來。只有商業模式的不斷豐富才能深化大數據的應用。目前,大數據與B2C、C2B、O2O等商業模式的結合及由大數據生態系統衍生出新的商業模式還處于探索階段。
五、 我國發展大數據產業的對策建議
順應趨勢,政府引導、深化應用、重視基礎研發工作是我國大數據產業謀求產業制高點、搶占先機的取勝之道,幾點建議如下。
(一)出臺大數據戰略規劃,加強政策引導和扶持
最為一項新的商業模式及技術,我國應盡快出臺國家層面的大數據發展戰略規劃,并以戰略資源的視角審視大數據產業。第一二次IT浪潮中,歐美國家的信息戰略規劃均先于我國,面對此次大數據的IT浪潮,我國應從政策層面,制定專項規劃、扶持并引導。
(二)制定相應的信息政策法規,開放公共領域的數據流動
政府公共管理及其他相關行業數據的流動性及共享問題涉及數據信息安全及公共的隱私權,如果過于開放會危及信息安全,過于封閉又影響大數據的共享及使用。如何把握合適的“度”也是我國信息監管部門及企業要關注的重點。我國產業政策制定者要在兩者之間做好權衡,以最經濟的方式開放數據資源,達到兩者的最優狀態。
(三)重視基礎軟件研發,搶占大數據生態系統主導位置
進入大數據生態系統不難,但占據生態系統主導位置較難。大數據生態系統中,任何一種商業模式都離不開基礎軟件的支持。用于解決數據存儲、分析、檢索等問題等軟件產品始終占據生態系統的主導位置。與Wintel聯盟時代不同,由于分布式文件處理軟件是開源模式,能夠擺脫國外企業的技術封鎖,對于我國而言,正是發展獨立自主基礎軟件的契機,產業資本及政策扶持應更多導向基礎軟件企業。
(四)深化大數據應用,布局智慧城市
智慧城市是我國大數據產業用武之地,巨大的需求將推動我國的大數據產業發展。要著力應用大數據最先進的技術,包括數據挖掘和功能的強大的運算系統,來整合分析跨地域,跨行業,跨部門的海量數據處理,將特定的知識應用于特定的行業和特定的解決方案中。大數據將成為智慧城市建設的推動力,同時智慧城市又是大數據深化應用的載體。
(五)開創多樣化商業模式,助力產業升級
明確的商業模式是深化大數據應用及盈利的前提。要積極推動大數據應用與電子商務、社交網絡及云計算的融合,并加大商業模式的創新力度,使大數據轉變為互聯網時代新一輪的生產力,助力我國產業的轉型與升級。


