好吊视频一区二区三区-国产精品V欧美精品V日韩精品-老司机亚洲精品影院-国产精品视频免费播放

物聯傳媒 旗下網站
登錄 注冊
RFID世界網 >  新聞中心  >  物聯網新聞  >  正文

AI和大數據讓科技公司的地位比從前更難撼動

作者:本站收錄
來源:大數據頭條
日期:2017-07-25 10:07:35
摘要:生活和經濟體發展越來越依賴科技進步,而科技公司的生態體系則依靠小公司不斷顛覆大公司來實現不斷創新和非壟斷。但當科技競爭涉及到由大數據庫驅動的機器學習時,大科技公司的地位將比從前更難以撼動。

  在新的一周里,谷歌發布了一項新的AI調查研究,這項研究再次彰顯當今AI事業蓬勃發展的強勢勁頭。消費者生活和經濟體發展越來越依賴科技進步,而科技公司的生態體系則依靠小公司不斷顛覆大公司來實現不斷創新和非壟斷。但當科技競爭涉及到由大數據庫驅動的機器學習時,大科技公司的地位將比從前更難以撼動。

  這項新研究由谷歌同卡內基梅隆大學(Carnegie Mellon University)投入大量資金一起合作完成,于周一公布了預印版。谷歌同CMU 大學花了整整兩個月時間將50個圖像識別器連接到一起,并采集了3億標識過的圖片。此項目的目的是檢驗在不調整算法而是進行大量數據輸入的情況下,機器能否更準確的識別圖像。

  答案是肯定的。 Google和CMU的研究人員對新的數據庫進行了一個標準的圖像處理系統培訓之后,他們表示機器在圖像識別相關的標準測試(如發現圖中的物體)中獲得了新的進展。顯然輸入數據的量和圖像識別的準確度之間有直接關系。這項發現明確了之前關于AI界能否在維持下現有算法、只增加數據輸入的條件下獲得更多產出的問題。

  由此發現可看出像谷歌、臉書和微軟這種數據巨頭公司,通過大數據的支持,會比之前預想的收益更大。谷歌3億圖像的數據庫并不能產出巨大利潤。圖像數據庫從1百萬增長到3億多帶來的識別精度增長只有3%。但此次研究論文的作者表示他們認為可以通過將軟件調整到更適合超大數據庫的方式來擴大優勢。即使最終這一預期沒能達成,但在科技界,一點小優勢也十分重要。舉個例子,在無人駕駛汽車中,視覺識別精準就特別關鍵。對于某些產品而言,哪怕只有絲毫的性能優化,也能快速的帶來幾十億的收入增長。

  囤積數據早已是以AI為主要業務公司的防御策略。像谷歌、微軟這樣的公司都已開放軟件甚至是硬件的源碼,但對能使這些工具有用的支撐數據卻并沒有這么開放。但也不是說數據不開放:去年,谷歌公開了從700多萬YouTube 視頻中采集的數據;Salesforce 也開放了從維基百科中收集的數據庫,方便算法可在各語言中使用。針對這些開放數據,來自AI開發實驗室Manifold的合伙人盧克·德·奧利維拉(Luke de Oliveira)和勞倫斯伯克利國家實驗室(Lawrence Berkeley National Lab)的訪問研究員表示(想必大家也想到了),這種公開的數據庫通常對潛在競爭對手而言價值并不高。“這種數據庫絕不是那種對產品后續市場定位有關鍵影響的數據庫。”

  谷歌和CMU的研究人員表示,他們希望他們最新的研究、所謂的“大數據”的價值,能催化創建處更大的、Google規模的開放圖像數據庫。他們寫道:“我們真誠地希望這能激發視覺界的人員不要低估數據,并開發集體努力來構建更大的數據集”。負責研究的CMU的Abhinav Gupta表示,想實現這一點,一個可行的選擇是與通用視覺數據基金會(Common Visual Data Foundation)合作,這是由Facebook和微軟發起的非營利組織,該公司已經發布了開放圖像數據集。

  同時,數據匱乏的公司想要在持有豐富數據的科技巨頭公司間生存下去,則更需要創新意識。 DataRobot公司首席執行官Jeremy Achin表示,機器學習對更多公司和行業而言越發重要,小型公司(認真地)將數據集中在一起,使其風險預測與較大競爭對手競爭的保險模式可能會受到更廣泛的關注。

  使機器學習更少的依靠數據的進步可以提高AI的數據經濟性; Uber去年收購了一家從事該項目的公司。但是現在也可以嘗試并回避AI傳統運營商通常的數據優勢。Fast.ai,一家致力于使機器學習更大眾化的公司,其聯合創始人雷切爾·托馬斯(Rachel Thomas)表示,初創公司可以在互聯網巨頭很少涉及的產業(如農業)展開機器學習。“我不確定這些大公司是不是在所有行業都那么有優勢。在很多領域,并沒有去收集相關數據”。即使人工智能巨頭公司也有未涉及的盲點區域。

人物訪談