科技公司的"軍備競賽":人工智能迎來大爆發
提起“人工智能”,人類似乎總會陷入某種過分的恐慌之中。去年10月,特斯拉公司CEO埃隆·馬斯克在美國麻省理工大學的一次演講中,將人工智能技術描述為“對魔鬼的召喚”。他說,研發出和人類智能勢均力敵的“人工智能”,可能是人類面臨的最大威脅。對于這點,馬斯克絕非在單打獨斗。哈佛大學的一位哲學家尼克·博斯特羅姆也把人工智能與全面核戰、巨型流星撞擊地球等一起列為巨型災難,而他本人正是“生存風險”這個概念的創始人之一。同時,劍橋大學“生存風險”研究中心的創始人里斯勛爵也認為,人工智能給人類帶來的生存威脅非常嚴重,而他曾經執掌英國最先進的科學團體—英國皇家學會。
人工智能的“軍備競賽”
不過,這些來自資深科技專家的深深憂慮,與人工智能這個領域內部充斥的樂觀態度以及迅猛發展,形成了鮮明的反差。一些世界知名大公司,如谷歌、Facebook、亞馬遜、百度,甚至開始了一場關于人工智能的“軍備競賽”,他們爭先恐后地挖角科學家、建立實驗室、購買啟動設備。總體看來,人工智能業內人士并不擔心被自己的造物所超越。其實他們也并沒有創造什么新的“思維模式”,只是讓原本只能由人來做的事情能夠被機器所完成而已。
近年來,從計算機、平板電腦和手機上產生的圖文數據浩如煙海,但計算機還是可以運用強大的計算能力將這些數據擺平。這多少說明了一件事:現在的智能終端,處理語言和圖像是越來越在行了。在商家雇主留意到這一點的同時,很多擔心自己飯碗的人也注意到了這一點。如果計算機能夠辨認圖像或翻譯語言,那么會引發兩種情況——要么促使智能計算機(或程序)的廣泛應用,要么使得一小部分會用這些計算機程序的人類工作效率大大提高。無論哪種情況發生,結果都會使不少從事圖像或語言工作的白領們站到等待失業救濟的隊伍中去。
現在,人工智能大爆發的跡象仍然比比皆是。去年,業內相傳谷歌為一個叫作“深思”的倫敦人工智能創業項目投入了4億美元,在Facebook的眼皮底下攫取了這個公司。而后者也在積極建立自己的人工智能實驗室。目前Facebook的實驗室由紐約大學的明星研究者雅恩·樂存領導。而谷歌曾經雇傭的人工智能大師級科學家——來自斯坦福的安德魯則又被挖角到了百度在硅谷建立的人工智能公司。同時位于芝加哥的敘事科學公司、位于英國劍橋和美國麻省的肯碩公司也都沐浴在投資人的“錢雨”之中。敘事科學公司致力于用人工智能撰寫財經報道(《福布斯》雜志現在已經開始應用這個發明),而肯碩公司則努力在開發一種能夠進行數據投資分析的人工智能。今年4月,IBM公司也宣布他們要在一款智能計算機的基礎上,研發一種能夠分析健康報告并提出醫療建議的人工智能,而這個作為基礎的Watson智能計算機,曾經在2011年一場美國智力競賽中完敗兩名人類冠軍。
人工智能的關鍵:能夠深層思維
其實,對人工智能的研究幾乎是與對計算機的研究同時開始的。其中最令人興奮的部分被叫作“深層學習”,以前也稱“機器學習”,它指的是計算機通過大量運算教會自己學習的一種能力。這個問題困擾人工智能研究者也不是一年兩年了。通常,對人類來說很困難的東西對計算機來說卻很簡單,比如一秒鐘進行多次復雜運算;而對人類來說很簡單的東西對計算機而言卻很難,比如聽懂一種語言或是辨認圖像中的各種物體或人臉。
各種運算、計算機只需要建立公式和方程規則,然后開始按照它們解方程就好。而對于語言或者圖像,計算機就沒有那么多清晰的規律可循了。舉個例子,正常的成年人很容易從一堆電影里分辨出色情片和藝術片(即使它們同樣都有裸露鏡頭),而這其中大腦是怎么運轉的卻沒人說得清楚——這個事實是由美國高等法院大法官波特·斯圖亞特發現。這位可敬的法官在試圖對色情片進行清晰定義時慘遭失敗,只好無奈地寫道:“我一看就知道這是個色情片!”
“機器學習”指的就是讓計算機學會這種它們不能給出清晰定義和規則的事情。做到這點也并非毫無可能,不過實在是需要非常非常巨量的數據運算。
為了解決這個問題,目前很多人工智能運用的是一種叫作“神經網絡”的技術。這種用來進行分析統計的技術雖然很有些年頭了,但其實非常有價值。早在1950年,研究者們就發明出了神經網絡結構,那時他們還不知道“智能”為何物,不過能夠確定的是,人類的大腦也有這樣的結構——人腦不是通過晶體管,而是通過神經元進行信息處理的。而神經元是一種多觸手、高聯結的細胞,他們通過彼此來傳遞生物化學信號刺激——這可能就是某種智能活動的形成。
神經聯網系統
然而,人類的神經元細胞極其復雜,要想模仿談何容易。至今能用在人工智能中的信號刺激與人類神經元之間傳遞的生物化學信號相比,簡直就是拙劣的卡通和真實世界的差距。但即使是最笨拙的模擬神經網絡系統,對某些任務來說也是相當有益的。微軟的人工智能專家克里斯·畢曉普指出,早在1960年,電話公司就曾經運用神經網絡結構來消除電話里的回音。不過,它需要的計算實在太多了,那時的計算能力限制了接受刺激信號的網絡范圍,從而限制了這種技術的發展。
最近幾年,由于要繪制電子視頻游戲中的圖像,電子芯片的計算能力被大大提高了,因此人們對神經網絡系統的興趣得以回升。以前那種幾十個或幾百個神經網絡系統被看作一個單層結構,而谷歌最新的研究成果中,能接受刺激的“神經元”高達10億個左右。正因為有了大量仿制神經元可供研究使用,科學家們可以將它們按照人類大腦的結構聯結起來,造出多層、分層結構,而正是這樣的結構,帶來了計算機“深層學習”的能力。
這種神經聯網的每一層都擔負著不同的任務。以人臉圖像處理的過程為例——
第一層主要處理原始圖像,它會注意到圖像中每個像素的亮度、顏色和它們在圖像中的分布情況;
第二層則會把第一層觀察到的東西用更抽象的方法歸類,分辨出圖像的邊緣、陰影等;
最后一層對圖像邊緣、陰影進行逐一分析,識別出眼睛、鼻子、嘴唇等特征。——這樣就可以完成對任何一張面孔的識別了。
要想讓這種機制真正起作用,需要對計算機進行訓練。訓練的方法是讓計算機處理大量的圖像,這些圖像中有的是人臉,有的不是。計算機的任務是將其中的人臉圖像分辨出來,這就需要它自己來給自己設定一定的程序,在統計規則中找出人臉的抽象共性。如果它處理真實世界的人臉圖像沒有什么問題,就說明訓練成功了。人聲識別系統的訓練也是同理。
要做到這一點,“深層學習”的算法需要努力去學習這些人類的技能,但是這其間還是需要人類幫助的介入。例如,在輸入圖像初期,人類要注明哪些是人臉,哪些不是,好讓計算機能有個大概的印象。早期的計算機的“教材”會受到數據量的限制,但互聯網的存在使得這個限制消失了——百度、谷歌和Facebook上面有著無窮無盡的圖像資源,而且上傳者還會對這些照片和圖像加標簽、作評論。“聰明”的計算機會從這些海量的“教材”和“注釋”中總結出模式、規律和范疇。
因此,計算機交出的答卷相當令人驚嘆。2014年,Facebook公布了一款名為“深度面孔”的算法,這個算法可以成功辨認出網絡上97%的真實人臉圖像,即使有些照片中人臉被遮住了一半或是光線很暗。這基本上已經達到了人類對面部的辨識能力水平。而微軟也在炫耀自己為科塔娜(一款數碼個人協助軟件)開發的高精度識別算法——這個算法能夠分辨出極其相似的彭布洛克威爾士科基犬和卡迪根威爾士柯基犬。所以,目前這種技術已經相當成熟,包括英國在內的一些國家已經在應用人臉識別系統處理邊境事務了。另外,除了圖像,從視頻和音頻中識別出人類跡象的技術,對警察和間諜來說也有著無法抗拒的吸引力。今年5月5日的一份官方報告中顯示,美國警察已經可以應用某種程序把電話錄音轉成文字,使得其中的某些信息更易在網上搜尋。
圖像識別是最基本最重要的能力
然而,互聯網上帶著標簽的照片盡管數量浩大,但也是有限的,人工智能的下一步是讓計算機掌握“無人監控和幫助”的學習。谷歌團隊的安德魯博士已經開發出了這種成果:它的計算機可以在數以億計youtube視頻中分辨出人臉和貓臉,而這些視頻并沒有任何的標簽或名稱。經過一段時間的分析,計算機也能自己找出規律并完美地完成這個任務。
更進一步的嘗試,是在一幅復雜的圖像中分辨出不同的組成部分。斯坦福大學的一篇論文中已經表明,某種計算機程序已經可以把一張早餐桌的照片中每種東西都分辨出來并用英語標注,如紅色的花、香蕉片或是一杯水等。
大型互聯網公司熱衷于人工智能的開發,主要是因為這項技術對他們來說利益攸關。短期來看,計算機算法對圖像、聲音的分辨能力越高,客戶查找搜索的時候就會越方便;從長遠來看,這項技術對智能機器人的發明意義十分重大,從自動駕駛汽車到戰場作戰機器人,在紛繁的真實世界識別圖像都是最重要也是最基本的能力。
圖像分辨技術也可以應用到現實的領域中去,谷歌眼鏡和微軟全息眼鏡已經開始使用這種技術了。美國舊金山的Enlitic公司也在嘗試用計算機圖像識別技術來支持X光和核磁共振圖像,這樣有可能發現一些醫生肉眼錯過的異常情況。
其實,深層學習能力不僅僅體現在圖像識別方面,任何一種需要大量接觸數據的領域都有它的用武之地,不管是運營保險公司還是從事遺傳學研究。在世界上最大的粒子實驗室CERN實驗室中,人們還真發現了人工智能深層學習的妙處——一個能夠深層學習的計算機自己寫了一套程序來識別亞原子粒子,它的程序居然比物理學家們自己編寫的程序更加有效。另外,一些研究者做了個會玩電子游戲的程序,這個程序玩起“太空入侵者”來居然超過了這些人類玩家。
并非機械中的鬼魂
更好的智能手機、更精密的機器人和更方便的網絡,對世界來說無疑是一種福音,但這些已經學會了圖像語言識別和自編程序的機器人,是否會讓文章開頭中馬斯克的擔心成為現實呢?這些聰明能干的計算機,是否超越了它的創造者的智商而邁出了重要、危險的一步呢?
這些“機器人末世論者”其實有一個很有力的論據握在手中——近年來對人類大腦的研究表明,人腦就是一架由正常細胞、正常原子構成的機器而已,它也遵循著一切科學自然原理,也就是說,并沒有一種叫作“精神”的東西來推動大腦的運行。創造出一個人造機械大腦,也許只是外觀上有所不同而已,原則上是完全可能也完全可行的。
不過,原則上可行和現實中的應用遠不是一回事。波士頓的Rethink Robotics公司的一個人工智能科學家羅德尼·布魯克斯指出,最令人糾結的是人們怎樣理解“智能”這個詞。是的,現在的計算機對某些目標的識別能力極其精確,讓人感覺毛骨悚然。但它們沒有目標、沒有動機,對自己的所作所為也沒有任何思考。在這些方面,人工智能并不比一張紙或一個天氣建模更加智能到哪里去。
其實,人工智能在運行中運用了很多非理性的方法,只不過產生的結果使得它們看起來像是有些“理性”而已。就像另一位人工智能先驅者埃德加·迪克斯特拉所說,人工智能只是看起來很厲害很復雜,“就像潛水艇看起來也很厲害很復雜,但它會思考嗎?”
另外還有一些例子可以輕易打消人們的疑慮。有研究者已經發表論文來論證這些所謂高智能的圖像分辨計算機是多么容易被人們愚弄,在沒有任何提示和任何背景提供信息時,這些智能軟件的答案往往令人啼笑皆非。研究者甚至可以制造出在人看來就是一團隨便涂鴉的圖像,但這些圖像有某種誤導智能軟件的能力,所以智能軟件往往把它們錯誤地識別成一種具體的東西。
不過,新技術的誕生總會影響到工作機會。也許在將來,人們的智能手機的計算能力就可以頂得上現在一座城中所有電腦的總和,那時人們不需要翻譯也不需要體檢醫生,一切相關服務都在他們的口袋里。而人們為此所付出的,只是一塊手機電池的費用而已。
總之,更加智能的計算機絕對是一種革命性的技術,但絕不是馬斯克先生和里斯勛爵所擔心的那一種。當然,也許在遙遠的未來,會有機器合成帶有人類性格的仿真大腦,但是在那一天到來之前,還是先擔心一下自己的工作會不會被眼前的人工智能搶走來得比較現實。



