射向人工智能的20顆子彈
數據科學和人工智能將如何吞噬世界?
1、之前二十多年的工作,主要涉及到數字化大數據集,建設基礎設施來管理大數據集,以及進行大數據集計算的范式。這些都是主要的驅動誘因,也可以解釋說,我們這個時代,首先強調的其實還是“數據科學”,然后才是“人工智能”。
2、一旦我們實現數字化數據,并獲得可編程的數據,那么明眼人就能看出,下一步就是利用這些數據在未來實現自動化和預測功能。當我們的預測能力變得越來越好,越來越“智能”,此時所謂的“數據科學”這個詞,才能逐漸的變成現在人們口中的“人工智能”。但事實上,兩者之間并沒有很很明顯的區別,“唯二的”區別,可能是在對新穎和難度的感知上有所不同。實際上,所謂新穎和難度,其實都會隨著時間而發生改變,今天的“人工智能”,就是明天的“數據科學”。
3、對數據進行學習的人工智能,被稱之為機器學習。傳統的機器學習使用的均是原始數據,然后提取出可以被人識別的語義(也被人認為是功能),接著,機器學習會從這些功能中再學習,繼而得出一個最終的機器學習模型。
4、過去的十年,神經網絡開始復蘇,它是基于在哺乳類動物的大腦中那些松散的突觸鏈接,形成的一種機器學習架構。神經網絡提取語義,讓人類進行處理。當然啦,在學習算法中導入的都是原始數據,這些數據都是沒有經過人類編輯的,于是,人們看似很隨意地就把它稱之為“機器學習”。
5、深度學習技術和學習模型已經存在了數十年,我們現在看到的,是一波理論創新的大潮,加上現在基礎設施和數據可用性愈發成熟,深度學習在經驗上也獲得了突破。2006年,NVIDIA推出了針對GPU的CUDA計算平臺,這是一個真正的分水嶺。
6、主要是因為人類構建的功能具有一定獨立性,深度學習是學習的自然工具。在數學推理上,人類技能的開發優先于人類自身能力,比如有一些我們過去學到的技能,比如理解負載的數學和語義構建的能力。有一些人類天生就擁有的技能集合,其實很難以一種高水準功能的形式,來準確地表達出來。
高緯度數據問題,數據的維度越高,那么它對人類來說,依靠傳統的機器學習技術來靠直覺感知就會變得更加困難,同時構建合適的功能也會變得難度更大。
7、對于那些在我們有能力構建復雜語義之前,已經開發的技能,我們已經在計算機視覺行業里中看到了令人印象深刻的結果,自然語言處理,甚至是玩兒視頻游戲。值得注意的是:這里我們所學習的所有技能都不需要數學推理,因此他們是能滿足獨立意識的高層次語義需要的。
8、在廣義的高緯度深度學習問題上,深度學習已經展示了突破性的成績,舉例包括基因組學,石油和天然氣,數字病理學,甚至是公開市場股市。
9、最近,媒體在大肆宣傳人工智能,因此人工一般只能也引起了人們的關注,它是一種假想的計算機模擬人類智能代理。
10、在很大程度上,人工一般智能是由那些基本擬人技能的深度學習成果尾風所驅動的,到目前為止,我們似乎還沒有什么有意義的進展,當然也沒有什么競爭力可言。從零到一,就像是在計算機視覺和自然語言處理上所作的努力一樣,也更好地說明了這個問題。
11、在不久的將來,這些努力似乎只能在筒倉(silos)上存在,在一些特殊的領域里,一群人會孤立地進行工作。
12、我們開發人工一般智能(AGI)的速度將不會受到任何一個筒倉的約束,但是我們有能力讓這些筒倉相互操作,并且通過合適的輸入和輸出渠道與外部世界聯系。首個人工一般智能可能不會是一個有人體表現的機器人,而是以一種實時在線的形式出現,它可以訪問全世界的知識,并且有能力通過網絡來進行交流。
13、人工一般智能將會模擬人類級別的智能,但是不會表現的“像人類”,知道我們了解、學習自己內部更多的“目標函數”。目前,計算機正在被訓練,它們會有專門的域來指定目標函數,這樣能把錯誤減少到最小。直到我們能夠知道如何將我們自己內部的目標函數校準,實現標準化,人工一般智能才會變得智能,甚至還會顯示出一些意識,但不會變得“像人類一樣”。
14、2025年以后出生的孩子,他們會覺得軟件能有意識,這種現象可能會忽然出現,速度也會比我們想象的要快得多。
15、人工一般智能對好壞區分的能力將會受到一定比例的限制,因為只有人類才能控制輸入和輸出渠道。未來,可能會出現很多有趣的爭論,話題就是人工一般智能可能存在的潛在惡意行為。最早出現,同時也是一個非常有力的實例就是,我們爭論過自動駕駛汽車。
16、對于人工智能初創公司來說,我們正處在一個上升的創新周期,同時也能有資金支持。
17、算法和人工智能學習技術商品化的速度,可能比我們預想的還要快。如果說這一領域里的初創公司想要獲得成功,那么就必須要不斷的用自己的人工智能模型和用戶、企業進行交互,然后尋找一些獨一無二的數據,并且不斷鞏固自己的初期優勢。最著名的就要數谷歌公司了,他們可以獲取點擊流數據,隨著時間,用戶(特別是企業用戶)可以利用這個數據作為私人數據源,也可以進行學習交互,來提升自己的排名。
18、雖然我們身處在人工智能的春天,但仍然是在早春階段。一旦有某個小團隊在人工智能領域里有所建樹,那么大型科技公司便會砸下重金,進行收購和兼并。這些人工智能領域里的新奇成就,如果說允許外部成熟一些,即便存在一定風險,對于大型科技公司來說也是可控的,因此我們到目前為止,已經看到了在人工智能領域里有較大規模的收購或兼并交易出現。
19、人工智能工具公司將會需要構建更具粘性的平臺,這樣才能在商品化相關產品的時候具有競爭力,同時也能讓風投看到一些有價值的產出。
20、最后,在未來五年,硅谷將會出現轉型過渡。如果那知名投資人Marc AndreeSSEn當初的一句話“軟件正在吞噬世界”來類比形容,那么就是“數據科學和人工智能正在吞噬世界”。



