有時候,“小數據”就夠用了
在思考你的事業有什么人工智能(artificial intelligence, AI)的實際應用時,很容易會以為,需要很大量的數據數據才能開始進行。人工智能是由數據驅動的,所以,你手上的數據愈多,你的人工智能就愈聰明。是嗎?不一定。
把人工智能應用到數據上,以擷取情報,在這么做的時候,情境脈絡(context)很重要。換句話說,你可以打造一個你能想象得出最大的數據湖(data lake),但是,假如你不知道要尋求什么,也沒有所需要的相關數據,你就不可能得到你想要的成果。
這是因為人工智能并不是魔法黑盒子,不會在吸收堆積如山的數據之后,就自動吐出結果。人工智能是指規模很大的一組技術,每種技術各有明確、調整過的目的。企業若能專注在他們期望看到的影響和目標,并把重心放在收集能配合那些目標的適當數據集,就有最佳機會可藉由人工智能,得到真正能發揮影響力的結果。
讓我們看看美國郵局(United States Postal Service,簡稱USPS)的郵件分類自動化經驗。USPS運用機器與光學字符識別技術(optical character recognition,OCR),目前已可在沒有真人協助下,判讀并處理98%的手寫地址郵件,以及99.5%的機器打印寄件數據郵件。USPS把這項技術,結合了規模相當小且很有限的美國郵政編碼和城市,現在每小時就可處理超過36,000份郵件。USPS近年來面臨嚴酷的財務危機,因此這個自動化作業帶來極大的好處。
使用小量但精準度高的數據,運用人工智能而得到很大的效益,這方面另一個有趣的例子是在航空業。2015年,波音公司(Boeing)與卡內基美隆大學(Carnegie Mellon University)合作創設航空資料分析實驗室(Aerospace Data Analytics Lab),為航空公司開發人工智能技術。其中一個計劃的目標,是要把維修紀錄標準化,以便運用人工智能,大幅降低維修成本。
每架飛機都被要求保留非常詳細的維修紀錄。然而,飛機在全球各地飛來飛去,溝通這些紀錄開始出現問題。第一個大問題就是最基本的語言障礙。其他的問題還更嚴重。有些紀錄是數字形式,有些是手寫的。有些維修人員遵守規定逐行記錄,但有些人只在紙的邊緣潦草寫下文字和縮寫。一般維修人員幾乎不太可能馬上轉譯這些不同的記錄方式。但如果運用人工智能,外加少量的飛機維修專門術語數據集,就能實時掌握并隨時轉譯這些紀錄。善用人工智能,來改善飛機維修工作流程的速度與正確性,可為航空公司省下數十億美元。
憑借精準的數據,人工智能就能帶來極大的影響,前述只不過是其中兩個實例而已。你要如何把這些想法應用在你的公司里?以下是三個主要步驟:
建立與企業標的相符的目標。在執行任何任務時,跨部門團隊共同訂立目標,確保目標與企業標的一致,是很關鍵的步驟,在人工智能方面也不例外。人工智能的本質是規范性的,你把企業目標的范圍界定得愈狹窄,數據集的情境脈絡愈明確,你就愈可能得到有意義的結果。
有一個常被忽略的重點,就是企業應為此建立一個跨部門團隊,而且讓整個組織都知道。這有助于決定,組織的哪些單位最需要人工智能的協助。如果你的團隊里有營運、銷售、財務部門的人和高階主管,就較可能找出真正的瓶頸和機會在哪里,你也較可能想出一些實際的解決方案,真的開始解決那些問題。
克服數據混亂狀態。每家公司都有一些對他們有獨特價值的數據集。然而,數據跟價值之間常常缺乏鏈接。你可能已握有數據,但它不夠清楚、明確,也無法實際使用。若想要克服數據混亂狀態、取出小量但非常精準的數據,有個好用的架構可以采用,就是聚焦在顧客、合作伙伴和供貨商的生命周期。按照生命周期,就能呈現其中所有的步驟、系統和利害關系人。檢視這些生命周期,可幫你找出會遺失價值的漏洞。這些都是你的機會,可創造清楚而可衡量的影響。專注在這些漏洞周圍的關鍵數據,就能獲得更精準且可使用的數據。
為你的任務選擇適當的技術。機器學習(machine learning)跟人工智能都受到高度關注,它們這么受矚目,是有道理的。這兩者都是令人驚嘆的技術,在任何企業對消費者(B2C)或企業對企業(B2B)的公司里,都可望為任何層級的高階主管創造價值。而且,使用它們的成本,甚至比五年前低了許多。不要雇用擁有上百位資料科學家的團隊,而應去查看那個正在成長的生態系統,選擇合適的工具,用來完成你想完成的任務。
在數字商業的世界里,企業總是在尋求大規模且快速的解決方案,也就是能讓他們取得優勢的大突破。但事實是,若你務實一點,就可以開始累積許多較小的成功果實,而且進行得很快。長期來看,逐步積累的成果也能發揮極大效用。
這就是看待人工智能的正確態度。它不是一個魔法黑盒子,而是一組高度專業化的工具。它不是要用來追求過于高遠的目標,而是要幫你解決實質問題。它的重點不在堆積如山的數據,而是要使用小量、高度精確的數據。(陳佳穎譯)



