AI視覺(jué)商業(yè)化萬(wàn)字大拷問(wèn):因何紛紛扎入零售場(chǎng)景?
“我們相信零售會(huì)成為我們第15個(gè)營(yíng)收過(guò)千萬(wàn)的行業(yè)。”商湯集團(tuán)總經(jīng)理尚海龍說(shuō)。
近三年,商湯代表的計(jì)算機(jī)視覺(jué)公司以算法和更高的精準(zhǔn)度打破海康、大華等傳統(tǒng)巨頭的藩籬,闖入相對(duì)封閉的安防領(lǐng)域。
隨著安防市場(chǎng)的紅海化,恰逢線(xiàn)下零售的升級(jí)換代,2017年下半年,視覺(jué)技術(shù)里大小玩家紛紛押注零售,安防領(lǐng)域的AI明星在思量這會(huì)不會(huì)成為下一個(gè)高地,在小眾領(lǐng)域耕耘已久的潛力股,也在期盼得到走向臺(tái)前的機(jī)會(huì)。
“通過(guò)技術(shù)賦能效果展現(xiàn)了以后,我相信整個(gè)零售行業(yè)真正進(jìn)入了從商品或服務(wù)來(lái)要利潤(rùn),轉(zhuǎn)成向數(shù)據(jù)要利潤(rùn),大家能夠意識(shí)到數(shù)據(jù)的價(jià)值,這個(gè)意識(shí)的轉(zhuǎn)變是偉大的。”
但是零售場(chǎng)景的分散化和多變性給新技術(shù)帶來(lái)了莫大考驗(yàn),也讓市場(chǎng)更加不確定。人工智能視覺(jué)能否被一片傳統(tǒng)土地接納,這是場(chǎng)復(fù)雜得多的踐行。
看清人臉是基本功
顧客在閘門(mén)前面對(duì)攝像頭站定,數(shù)秒后連接攝像頭的屏幕上出現(xiàn)機(jī)器采集的人臉,即完成身份認(rèn)定,購(gòu)物結(jié)束再次刷臉可支付離店。在蘇寧體育Biu門(mén)店里,這張臉也正是用戶(hù)的逛街ID,攝像頭以及背后的機(jī)器兢兢業(yè)業(yè)地記錄著:男,25歲,在耐克鞋前停留時(shí)間較長(zhǎng),購(gòu)買(mǎi)了一頂鴨舌帽。
蘇寧Biu的視覺(jué)解決方案由商湯提供,對(duì)于CV(即:計(jì)算機(jī)視覺(jué) computer vision)明星公司而言,識(shí)別人臉乃看家本領(lǐng)。2014年,商湯創(chuàng)始人湯曉鷗的聯(lián)合實(shí)驗(yàn)室用20萬(wàn)人臉數(shù)據(jù)達(dá)到98.52%準(zhǔn)確率的成績(jī),超越人眼,在業(yè)界一炮而紅,之后,商湯以技術(shù)優(yōu)勢(shì)殺入資金充沛、需求剛性的安防市場(chǎng)。
“圖像四小龍”商湯、依圖、曠視、云從發(fā)展路徑類(lèi)似,去年都完成數(shù)億元融資。三四年前,全國(guó)安防設(shè)備產(chǎn)生的海量數(shù)據(jù)亟待處理分析,比如如何在火車(chē)站的人海中扒出流竄的犯罪嫌疑人,把持政府項(xiàng)目的傳統(tǒng)巨頭卻無(wú)力消化,人工智能視覺(jué)“趁機(jī)而入”。
2017年,尤其是下半年,隨著新零售、智慧零售的概念落地,視覺(jué)明星們也陸續(xù)殺入其中,包括商湯、曠視、依圖、圖普、閱面等等。它們以“刷臉進(jìn)場(chǎng)“和“刷臉支付”占到一席之位,商湯與蘇寧聯(lián)手,曠視拿下了阿里巴巴的淘咖啡,圖普把技術(shù)鋪到了天福超市、EasyGo以及OPPO……
兩項(xiàng)功能被廣泛應(yīng)用于無(wú)人門(mén)店和升級(jí)改造中的傳統(tǒng)零售店,這也是目前視覺(jué)技術(shù)最被熟知的功能,最直接的效果是可以簡(jiǎn)化收銀環(huán)節(jié),節(jié)約成本。
當(dāng)然,初出茅廬,在陌生的零售場(chǎng)域打拼容易么?
“AI不具備普適性,沒(méi)有萬(wàn)能的,不同場(chǎng)景對(duì)算法的要求不一樣。相比安防和金融,零售的場(chǎng)景太復(fù)雜多變了。”一位視覺(jué)產(chǎn)品經(jīng)理感嘆道。
據(jù)透露,目前的刷臉技術(shù)其實(shí)相對(duì)簡(jiǎn)單。“市場(chǎng)上提供的算法多是正面底庫(kù)識(shí)別,這種門(mén)禁模型做線(xiàn)下零售是有一定的問(wèn)題。線(xiàn)下零售要做到無(wú)感知,可能不是通過(guò)注冊(cè)的人臉做識(shí)別,而是第一次進(jìn)店的抓拍作為底庫(kù),可能光線(xiàn)不好,可能有遮擋,可能是側(cè)臉,這就需要專(zhuān)門(mén)的訓(xùn)練。”
尤其是涉及支付環(huán)節(jié),必須人為設(shè)置固定的靜態(tài)場(chǎng)景,強(qiáng)制要求消費(fèi)者配合,即便是人臉識(shí)別老大商湯所搭建的蘇寧Biu店也依托于閘門(mén)。
“現(xiàn)在謹(jǐn)慎一點(diǎn)的,像各大銀行ATM刷臉取款增加六位密碼確認(rèn);大膽一點(diǎn)的,像蘇寧門(mén)口有閘機(jī),結(jié)賬一個(gè)個(gè)排隊(duì),這樣支付環(huán)境有固定的靜態(tài)場(chǎng)景,準(zhǔn)確率基本可以做到百分之百。大量的動(dòng)態(tài)比對(duì)會(huì)成問(wèn)題。”尚海龍說(shuō)。
理論上,機(jī)器視覺(jué)不是沒(méi)辦法抓取非配合條件下的動(dòng)態(tài)人臉,火車(chē)站里抓捕逃犯就涉及到人臉檢測(cè)、特征提取、比對(duì)多項(xiàng)技術(shù),機(jī)器先在一幀視頻中框出所有的人臉,然后挨個(gè)與公安機(jī)關(guān)的照片數(shù)據(jù)庫(kù)對(duì)照。但問(wèn)題在于,場(chǎng)景的變化要求對(duì)算法同步調(diào)整優(yōu)化。
簡(jiǎn)24原本調(diào)用過(guò)外部的技術(shù),但后來(lái)選擇了自主研發(fā)。“并不是因?yàn)橥獠考夹g(shù)不好,在機(jī)場(chǎng)這種公共場(chǎng)所,能從茫茫人海當(dāng)中一眼把恐怖分子識(shí)別出來(lái),產(chǎn)品挺牛的,但關(guān)鍵問(wèn)題在于,第一,需要為我們的場(chǎng)景做優(yōu)化,任何的算法都要根據(jù)本地場(chǎng)景優(yōu)化才能達(dá)到最好的效果。第二,它們的訓(xùn)練人群和我們的不一樣。”創(chuàng)始人林捷透露。
同時(shí),人臉本身的局限性能否完全應(yīng)用于零售業(yè)也存在爭(zhēng)議。“我們認(rèn)為外部特征不能作為人的終生ID,或者綁定金融支付,很危險(xiǎn)的。”深蘭科技創(chuàng)始人陳海波說(shuō)。他對(duì)自家的“不要臉運(yùn)動(dòng)”深以為豪,以?huà)呤秩〈⒛槪瑨叩氖庆o脈、動(dòng)脈和毛細(xì)血管,以每一根血管的分叉點(diǎn)和點(diǎn)與點(diǎn)之間位置關(guān)系為特征值。“我們的N值達(dá)到4億(能與4億數(shù)據(jù)做對(duì)比,簡(jiǎn)單說(shuō),N值越高算法和算力越強(qiáng)),再加上4位手機(jī)號(hào)碼,做到了40億。”
公開(kāi)數(shù)據(jù)顯示,商湯2017年有20億張人臉數(shù)據(jù),2億個(gè)體訓(xùn)練,達(dá)到9位密碼時(shí)代。
進(jìn)場(chǎng)之后,靠臉的可能性也不大了。
“一說(shuō)到視覺(jué)技術(shù)就想到刷臉,其實(shí)這是最為簡(jiǎn)單基礎(chǔ)的功能。”林捷說(shuō),“進(jìn)場(chǎng)之后拍不到人臉,靠體態(tài)識(shí)別這個(gè)人,知道他拿了什么商品,這比較難。”
業(yè)內(nèi)公認(rèn)的、視覺(jué)技術(shù)應(yīng)用的極致表現(xiàn)為Amazon Go,全程通過(guò)機(jī)器捕捉看了什么,拿走了什么,離店后自動(dòng)扣款,當(dāng)然,為確保準(zhǔn)確性,Amazon Go還采用了重力感應(yīng)器、二維碼、紅外感應(yīng)器等輔助技術(shù)。
深蘭于2016年4月發(fā)布了無(wú)人值守零售解決方案,陳海波告訴億邦動(dòng)力網(wǎng),人與貨關(guān)聯(lián)的算法極為復(fù)雜,“入場(chǎng)時(shí)采集到人的數(shù)據(jù),包括人的體型,頭到地面的距離,肩到地面的距離,這是一個(gè)綜合數(shù)據(jù),攝像頭一直在追蹤用戶(hù)。在商品區(qū)有一條無(wú)形的電子?xùn)艡冢稚爝M(jìn)去以后觸發(fā)攝像頭開(kāi)始抓取動(dòng)作。攝像頭以每秒30幀抓取手,當(dāng)觸及商品時(shí)每秒120幀, 同時(shí)實(shí)時(shí)去背,扣掉背景,讓攝像頭都集中看商品,更精準(zhǔn)判斷它是什么。”
“全程要調(diào)動(dòng)多個(gè)攝像頭協(xié)同監(jiān)控,實(shí)時(shí)調(diào)整每個(gè)攝像頭的權(quán)重。如果商品和背景一個(gè)顏色,那機(jī)器大腦也沒(méi)辦法了。”
你們這方案多少錢(qián)?
“零售毛利低,對(duì)每一筆投資都會(huì)非常謹(jǐn)慎。相應(yīng)而言,它是一定要看到效果才會(huì)投資。”尚海龍說(shuō)。
從安防到零售,作為服務(wù)方的計(jì)算機(jī)視覺(jué)公司明顯感知到客戶(hù)預(yù)算的銳減。
比如,公安系統(tǒng)的視頻監(jiān)控方案并非適用一般的零售商,“它本身使用是公安內(nèi)網(wǎng),一個(gè)本地化的服務(wù)器集群,用物理服務(wù)器去承載所有的視頻流,服務(wù)對(duì)象的特性決定了方案的設(shè)計(jì)。”一位視覺(jué)從業(yè)者表示。
普通零售商針對(duì)視頻監(jiān)控則必須考慮:第一,本地加服務(wù)器,購(gòu)買(mǎi)服務(wù)器需要幾萬(wàn)元,而且需要人維護(hù),還要防止偷盜丟失破損;第二,云加端,視頻流傳到云端處理方案的網(wǎng)絡(luò)帶寬成本加云端GPU服務(wù)成本也不低,傳輸至少一個(gè)720P或者一個(gè)高清碼流,帶寬少說(shuō)要4M,一個(gè)CPU服務(wù)器,大概阿里是500塊錢(qián)一年,GPU是3000塊錢(qián)一年;第三,壓縮視頻流上傳云端,會(huì)丟幀失真,效果很差。
“政府項(xiàng)目可以說(shuō)不計(jì)成本,以達(dá)到最好的效果,這和商業(yè)的邏輯不一樣。
硬件占據(jù)方案成本中的大頭,包括GPU、相機(jī)以及各類(lèi)感應(yīng)器等。
后臺(tái)分析是店里配備小型硬件處理站還是走云端,包括私有云、公有云還是混合云,廠(chǎng)商們提供了開(kāi)放選擇。圖普負(fù)責(zé)零售產(chǎn)品的劉凱解釋稱(chēng),上不上GPU由客戶(hù)需求決定,云端分析處理的好處是及時(shí)性更強(qiáng),剛到店的客人馬上就能被識(shí)別出來(lái),模型、程序的更新也是在云端完成,無(wú)需人工干預(yù),但是對(duì)網(wǎng)絡(luò)傳輸要求高;本地化分析則幾乎不占用忙時(shí)帶寬,在本地分析完后再在閑時(shí)將分析結(jié)果上傳到服務(wù)器。
“根據(jù)客戶(hù)實(shí)際的需求以及資源的限制來(lái)做選擇,沒(méi)有最好的,只有最適合的。”劉凱說(shuō)。
相機(jī)有原本線(xiàn)下就在用的幾百塊的普通攝像頭,也有動(dòng)輒上千的深度版,還有方案提供商自主設(shè)計(jì)的獨(dú)家產(chǎn)品。
普通相機(jī)是單目的,2D成像,而深度相機(jī)通過(guò)雙目或3D結(jié)構(gòu)光或加紅外模組實(shí)現(xiàn)3D效果,也就可以知道物體離相機(jī)多遠(yuǎn),當(dāng)然價(jià)格也更貴。
“我們現(xiàn)在用2D相機(jī),通過(guò)算法模擬3D,當(dāng)然,如果用深度相機(jī)模組可以更準(zhǔn),但成本太高了。”一位產(chǎn)品經(jīng)理表示。
原有的設(shè)備可以用起來(lái)。“原來(lái)已經(jīng)投資過(guò)的東西我們不會(huì)進(jìn)行破壞性的損傷,攝像頭我們要200萬(wàn)像素以上就可以,原來(lái)超市里已有的攝像頭直接就可以用,并聯(lián)進(jìn)我們的系統(tǒng)就可以。“尚海龍表示。
圖普向天福超市提供的改造方案正復(fù)用了原有攝像頭,對(duì)接CRM系統(tǒng)拿到會(huì)員頭像和消費(fèi)記錄,自動(dòng)識(shí)別VIP,精準(zhǔn)發(fā)送促銷(xiāo)廣告。
如何把握效果和成本之間的天平,是初來(lái)乍到玩家的必修課。
“如果不計(jì)成本的話(huà),我們的精度早就上去了。”簡(jiǎn)24創(chuàng)始人林捷說(shuō)。
簡(jiǎn)24是Amazon Go的國(guó)內(nèi)追隨者。Amazon Go由亞馬遜在2016年底發(fā)布,主打拿了就走、不需排隊(duì)的,引發(fā)業(yè)內(nèi)震撼。今年年初,亞馬遜從內(nèi)測(cè)正式向公眾開(kāi)放,而經(jīng)過(guò)兩年的時(shí)間,技術(shù)圈和零售圈的人也都意識(shí)到這只是個(gè)“show case”,實(shí)在不具備大規(guī)模復(fù)制可能性。
根據(jù)公開(kāi)報(bào)道,Amazon Go在160平米的空間里布置了上百個(gè)攝像頭,RGB和深度攝像頭結(jié)合,并采用了紅外線(xiàn)感應(yīng)器和重力感應(yīng)器,盛傳成本高達(dá)千萬(wàn)美金。
推出了2.0版本的林捷用的是“幾百塊“的普通攝像頭,也不能布置太多,依靠算法迭代來(lái)提升精度。
“還是要回到商業(yè)的本質(zhì),攝像頭的價(jià)格和數(shù)量肯定對(duì)效果有影響,但是在零售場(chǎng)景下,成本太高根本不能收回投資,這個(gè)商業(yè)模式就不成立了。”林捷說(shuō)。
懂零售
一套設(shè)計(jì)方案中,算法、硬件、 場(chǎng)景互相適配,構(gòu)成一個(gè)完整的三角形。方案設(shè)計(jì)得是否符合“商業(yè)的邏輯”,很大程度上取決于對(duì)零售的理解程度。
零售是創(chuàng)新工場(chǎng)AI工程院今年的主打行業(yè),聯(lián)合創(chuàng)始人王晶表示,人工智能團(tuán)隊(duì)當(dāng)中要有行業(yè)專(zhuān)家,每次見(jiàn)客戶(hù)最長(zhǎng)的時(shí)間花在了解對(duì)方的實(shí)際業(yè)務(wù)上。
劉凱告訴億邦動(dòng)力網(wǎng),不同類(lèi)型的零售商間差異會(huì)比較大,但即便同一類(lèi)型的零售商客戶(hù),在管理上的需求也存在很大差異。
“做家居的客戶(hù)會(huì)希望我們能按家庭的維度去識(shí)別客戶(hù),而賣(mài)日用品的客戶(hù)可能更急迫于知道有哪些人是回頭客。在同類(lèi)的零售商中,根據(jù)客戶(hù)自身管理目標(biāo)的不同,共性的需求也會(huì)在指標(biāo)要求上有差異,如對(duì)準(zhǔn)確率、召回率的要求有所不同,差異化的個(gè)性化需求,未必在整個(gè)行業(yè)間通用。”劉凱說(shuō)。
王晶認(rèn)為,方案的優(yōu)劣不僅取決于算法,很多時(shí)候是工程上的問(wèn)題。“比如,要從用戶(hù)的整個(gè)流程體驗(yàn)的角度考慮,怎樣有一個(gè)很好的結(jié)賬流程,讓用戶(hù)感覺(jué)更順暢,反之不管技術(shù)多炫酷,如果用戶(hù)不舒服,商家都不會(huì)買(mǎi)單的。”
深蘭在克制技術(shù)的無(wú)限延展。“柜子可以只裝四個(gè)攝像頭或者六個(gè)攝像頭,攝像頭多了,GPU算力需求比較大,成本高。基本上你故意要偷也能偷走,但是問(wèn)題是大多數(shù)人正常購(gòu)買(mǎi),而且如果貨少了,我們調(diào)取視頻也會(huì)發(fā)現(xiàn),還和其他公司共享信用,偷竊查出來(lái)后就上黑名單了。”陳海波介紹。
即便Amazon Go也有針對(duì)零售場(chǎng)景而變通的一面。其貨架使用的重力感應(yīng)器其實(shí)存有隱患,理論上,小偷可以快速把商品替換成其他東西(比如一袋沙子)而不被發(fā)現(xiàn),不過(guò)考慮到這是多人同在的場(chǎng)景,類(lèi)似的偷盜實(shí)施起來(lái)比較困難也就忽略了。
林捷總結(jié)出來(lái)一套經(jīng)驗(yàn):不要讓技術(shù)花時(shí)間在運(yùn)營(yíng)能夠解決的問(wèn)題上。“幾十個(gè)人擠在柜臺(tái)前結(jié)賬,這樣的場(chǎng)景就不要讓視覺(jué)科學(xué)家去研究了,機(jī)器分不清楚誰(shuí)買(mǎi)了什么,就讓顧客排隊(duì)好了。”這些取舍建立在零售業(yè)的理解上,技術(shù)大咖補(bǔ)課不足就容易掉坑。“有的(方案)為了做到更好的商品識(shí)別效果,會(huì)加高貨架的層高,降低層數(shù),一般貨架有5到6層,變成了4層。”林捷強(qiáng)調(diào),這是損傷便利店平效的本末倒置,“如果了解零售,絕對(duì)不會(huì)在技術(shù)設(shè)計(jì)上犧牲平效的。”
商品識(shí)別方興未艾
要實(shí)現(xiàn)對(duì)人貨關(guān)系互動(dòng)的記錄以及無(wú)人結(jié)算,繞不開(kāi)談商品識(shí)別。這也是視覺(jué)科學(xué)家在爭(zhēng)奪的新高地,“前幾年我們刷榜刷的都是人臉,刷爛了,現(xiàn)在物體是最難的。”一位業(yè)內(nèi)人士透露。
去年,曠視參加了COCO競(jìng)賽的物體檢測(cè)、人體關(guān)鍵點(diǎn)和物體分割三個(gè)單項(xiàng)比賽,獲得兩個(gè)第一和一個(gè)第二。碼隆科技取得了 WebVision競(jìng)賽的第一名。
相比人臉識(shí)別,商品識(shí)別還徘徊在起跑線(xiàn)上。傳統(tǒng)商超、便利店和品牌店升級(jí)改造,都一般采用條形碼、RFID這些“老古董”技術(shù),即便繽果盒子這樣的創(chuàng)新項(xiàng)目也啟用了RFID。
“因?yàn)镽FID是一個(gè)比較偏成熟的方案,最早選擇它在創(chuàng)業(yè)上是make sense(說(shuō)得通)的。圖像識(shí)別技術(shù)可能更領(lǐng)先、挑戰(zhàn)更大。”華映資本投資總監(jiān)姜志峰說(shuō)。
總得來(lái)說(shuō),人臉相對(duì)標(biāo)準(zhǔn)化,可以把人種作為單獨(dú)訓(xùn)練模型,而零售涉及的商品SKU多而雜,每個(gè)類(lèi)別單獨(dú)訓(xùn)練難度大,不可控性更高。機(jī)器識(shí)別每張照片的基本邏輯是:每張照片有向量,即多組數(shù)字,某幾個(gè)組合起來(lái)代表袖長(zhǎng)、顏色、款式等特征,機(jī)器根據(jù)數(shù)字判斷自己“看見(jiàn)”的是啥。但是,如衣服這種柔性物體易變形,不同穿法或者扭曲、折疊在圖片中像素排列不同,讓計(jì)算機(jī)明白它們是同一件的不同形態(tài)很難。
此外,現(xiàn)在人臉識(shí)別已經(jīng)可以把算法做到手機(jī)里,比如刷臉解鎖,而物體識(shí)別暫時(shí)還要基于GPU或者X86這種高性能的硬件架構(gòu),成本較高。
“WebVision競(jìng)賽上李飛飛給我們頒的獎(jiǎng)。”碼隆創(chuàng)始人黃鼎龍強(qiáng)調(diào)。
和曠視不一樣,物體識(shí)別是碼隆們安身立命的根本。此外,國(guó)內(nèi)市場(chǎng)上頭部玩家還有衣+、Visenze。
與人臉識(shí)別早早收割了安防的麥田不同,商品識(shí)別長(zhǎng)時(shí)間以來(lái)被認(rèn)為應(yīng)用場(chǎng)景不明確,空有技術(shù)難變現(xiàn),玩家們?cè)诼L(zhǎng)的商業(yè)化探索中走出了不同的萬(wàn)里長(zhǎng)征。
三家業(yè)務(wù)都在電商上下了大力氣。碼隆和衣+最初做的都是以以圖搜圖為核心的to C產(chǎn)品,類(lèi)似淘寶“拍立搜”,后來(lái)轉(zhuǎn)向2B服務(wù),一個(gè)建立了Product AI平臺(tái),將識(shí)別能力開(kāi)放給電商平臺(tái)、品牌、圖庫(kù)等商家;另一個(gè)則鎖定了媒體和大屏等,比如,在優(yōu)酷視頻上即看即買(mǎi),跳轉(zhuǎn)進(jìn)入淘寶購(gòu)物,即通過(guò)衣+的技術(shù)實(shí)現(xiàn)。
“線(xiàn)上的調(diào)用量在緩慢增長(zhǎng)。”黃鼎龍說(shuō),從碼隆的經(jīng)驗(yàn)拉里看,線(xiàn)上市場(chǎng)有需求,但不會(huì)迅速爆發(fā)。為更快打開(kāi)市場(chǎng),碼隆還把精力投向商家后端,比如,利用圖像識(shí)別技術(shù)實(shí)現(xiàn)一鍵生成產(chǎn)品詳情頁(yè)功能。
黃鼎龍認(rèn)為,經(jīng)過(guò)幾年的數(shù)據(jù)積累和算法迭代,加之新零售風(fēng)潮愈來(lái)愈熱鬧,商品識(shí)別應(yīng)用于線(xiàn)下的機(jī)會(huì)到了。
“這個(gè)事情能不能成立取決于是否useable(可用的)和useful(有用的),一方面,在技術(shù)上要達(dá)到基本可用的狀態(tài),這是很重要的前提條件,別人試了不work就不行;另一方面,也得有用,17年隨著零售領(lǐng)域的(興起),大家開(kāi)始覺(jué)得有用。“黃鼎龍說(shuō)。
Yi+也在向線(xiàn)下零售進(jìn)發(fā),無(wú)人店和快消品品牌是其目前主要客戶(hù)群體。“我們的數(shù)據(jù)積累,和客戶(hù)建立起的反饋機(jī)制,都是難以短時(shí)間跨越壁壘。”Yi+產(chǎn)品負(fù)責(zé)人說(shuō)。
不過(guò),Visenze的興趣還不大,它總部在新加坡,主要為海外客戶(hù)提供以圖搜圖技術(shù),例如樂(lè)天、H&M等。
CTO李廣達(dá)認(rèn)為,計(jì)算機(jī)視覺(jué)技術(shù)還沒(méi)有達(dá)到大范圍應(yīng)用于實(shí)體零售的程度。“計(jì)算機(jī)視覺(jué)有mission critical(關(guān)鍵任務(wù))和非mission critical兩種場(chǎng)景,區(qū)別在于效果的可信度。攝像頭解決方案可以一定程度上提升效率,但是有些場(chǎng)景還不能完全信任。”
他認(rèn)為,電商環(huán)境的以圖搜圖是典型的非mission critical(關(guān)鍵任務(wù))場(chǎng)景。盡管當(dāng)涉及到一些細(xì)節(jié)屬性,比如顏色、領(lǐng)子類(lèi)型、袖子長(zhǎng)短等等,準(zhǔn)確度會(huì)打折扣,但這可以慢慢打磨。
大而無(wú)當(dāng)還是前途無(wú)量?
商品識(shí)別是不是真的“useful”,即能否商業(yè)化、是否值得研究尚存爭(zhēng)議。
圖普科技和商湯暫時(shí)都還未涉及。“廠(chǎng)商對(duì)這方面熱情還比較高,但可能需求不夠聚焦,如何深度結(jié)合實(shí)際業(yè)務(wù)還需要探討。”劉凱說(shuō)。圖為使用RFID的CITYBOX。

“商品的識(shí)別有一些創(chuàng)業(yè)公司在做,術(shù)業(yè)有專(zhuān)攻,市場(chǎng)這么大,我們做好自己的事情就好了。我個(gè)人判斷它(機(jī)器視覺(jué)識(shí)別商品)的價(jià)值意義沒(méi)那么大。”尚海龍介紹稱(chēng),蘇寧Biu店賣(mài)球鞋、運(yùn)動(dòng)衣,感應(yīng)電子標(biāo)簽(RFID)即可結(jié)賬。
RFID在服裝行業(yè)尤其受到歡迎。“視覺(jué)技術(shù)可能在某些產(chǎn)品上取代RFID,服裝可能比較難。“馬克華菲CIO兼任電商總經(jīng)理左敬東說(shuō)。
馬克華菲有100多家智慧門(mén)店,商品配置RFID標(biāo)簽,通過(guò)物聯(lián)網(wǎng)識(shí)別器,消費(fèi)者試穿衣服時(shí)站到智能試衣鏡前,大屏可自動(dòng)識(shí)別商品ID,向消費(fèi)者展示模特試穿效果、產(chǎn)品介紹、評(píng)價(jià)、相關(guān)搭配等內(nèi)容。
除了前端展示,RFID在后端零售庫(kù)存管理上優(yōu)勢(shì)明顯。“正常門(mén)店進(jìn)行庫(kù)存盤(pán)點(diǎn),3000件衣服,2個(gè)人,原來(lái)需要半天到1天時(shí)間。利用RFID芯片,用掃描槍片式感應(yīng)進(jìn)行群讀掃描,1個(gè)人,僅需15分鐘就能完成全部盤(pán)點(diǎn)。”茵曼母公司匯美CMO肖海坤表示。
不過(guò),RFID也有未解決的難題:每件商品都要加貼至少三四毛錢(qián)的標(biāo)簽,人工和材料成本高,且遇金屬和液體等不識(shí)別或效果差。
除了機(jī)器視覺(jué)和RFID,市面上的還有消費(fèi)者自己拿商品掃碼結(jié)賬、重力感應(yīng)等方案。如下圖物美超市的自助收營(yíng)臺(tái)。

“掃碼對(duì)商戶(hù)來(lái)說(shuō)成本低且簡(jiǎn)單,但建立在信用基礎(chǔ)上,盜損大,且顧客自己動(dòng)手影響用戶(hù)體驗(yàn)。重力感應(yīng)是老技術(shù)在零售領(lǐng)域的新應(yīng)用,無(wú)法判斷具體哪件商品,知道哪個(gè)貨架被動(dòng)過(guò)。”
陳海波本人是機(jī)器視覺(jué)忠實(shí)擁護(hù)者,“未來(lái)商店一定是沒(méi)有營(yíng)業(yè)員,商品、編碼、條形碼不存在,商品一定要能夠被遠(yuǎn)距離非接觸識(shí)別。”
不單單是未來(lái),也有人已然找到了細(xì)分場(chǎng)景的即時(shí)需求。
王晶認(rèn)為不能用RFID的場(chǎng)景也是機(jī)器視覺(jué)的機(jī)會(huì),比如蛋糕店,“蛋糕都是用盤(pán)盛的,怎么貼標(biāo)簽?”還有超市的自助稱(chēng)重機(jī)也可以改用視覺(jué)識(shí)別,因?yàn)?ldquo;在顯示屏的一頁(yè)頁(yè)商品中區(qū)分查找蛇果和富士蘋(píng)果的體驗(yàn)很差”。
國(guó)外還有專(zhuān)門(mén)從事快消品貨架識(shí)別的Trax,在全球50個(gè)國(guó)家有175個(gè)客戶(hù),不乏可口可樂(lè)、百威、雀巢、漢高、百事這樣的大品牌,每月處理2.5億的SKU產(chǎn)品。
剛剛就任中國(guó)區(qū)負(fù)責(zé)人的王茜介紹,Trax已形成“交鑰匙”式解決方案:兩米多的貨架只需一個(gè)成本“幾美金”的攝像頭,品牌商使用手機(jī)拍照即可。
最基本的,品牌商銷(xiāo)售代表把貨架照片上傳至云端解析,監(jiān)督門(mén)店;零售商安裝固定攝像頭,實(shí)時(shí)監(jiān)測(cè)動(dòng)態(tài)變化;也可以在冰箱上裝上小小的攝像頭,每開(kāi)關(guān)一次拍攝一張照片,記錄銷(xiāo)售情況。Trax聲稱(chēng),服務(wù)的快消品公司斷貨率下降10%到15%,整體銷(xiāo)售業(yè)績(jī)提升3%到5%。
Trax核心市場(chǎng)在美國(guó),今年1月正式進(jìn)入中國(guó),目標(biāo)三年內(nèi)中國(guó)市場(chǎng)年收入達(dá)到1億美元。
用視覺(jué)技術(shù)識(shí)別貨架商品在國(guó)內(nèi)少見(jiàn),土生土長(zhǎng)的Yi+也打算深耕。“國(guó)內(nèi)的快消公司相對(duì)傳統(tǒng),我們的本土優(yōu)勢(shì)比較明顯,而且以服飾和商品識(shí)別起步,在零售方面也有優(yōu)勢(shì)。”銷(xiāo)售負(fù)責(zé)人稱(chēng)。
他表示,貨架識(shí)別在國(guó)內(nèi)處于空白狀態(tài),快消品公司也有迫切需求。“它們一般需要向超市或者門(mén)店交納進(jìn)場(chǎng)費(fèi),獲取貨架數(shù)據(jù)非常關(guān)鍵,很關(guān)心自己的貨擺得好不好,銷(xiāo)售量好不好,每天有什么變化,之前都沒(méi)辦法及時(shí)統(tǒng)計(jì)。”
當(dāng)然,蛋糕店和超市愿不愿意買(mǎi)創(chuàng)新工場(chǎng)的視覺(jué)方案,Trax能不能賺到1億美元,Yi+能不能成功挖掘到本土客戶(hù),這些都將被2018年所檢驗(yàn)。
“我們希望通過(guò)AI降本增效,如果兩點(diǎn)都能做到的話(huà),我們就會(huì)把它商業(yè)化落地,如果最后得出的結(jié)論是用視覺(jué)無(wú)法真的做到的話(huà),可能就不會(huì)做類(lèi)似的產(chǎn)品。頂多做點(diǎn)展示,表明我們有這個(gè)能力而已。”正在關(guān)注商品識(shí)別的計(jì)算機(jī)視覺(jué)產(chǎn)品經(jīng)理說(shuō)。
技術(shù)賣(mài)給誰(shuí)?
陳海波喜歡向投資人就什么零售項(xiàng)目值得投提建議,他本身確實(shí)也在密切關(guān)注,因?yàn)檫@決定了技術(shù)要賣(mài)給誰(shuí)。
他認(rèn)為,AI技術(shù)提供方人力成本高昂,必須要接規(guī)模化的項(xiàng)目,而單個(gè)項(xiàng)目不值得投入。“如果客戶(hù)開(kāi)一個(gè)店做秀,沒(méi)有意義的。我們要拿下市場(chǎng),就必須找到具備成千上萬(wàn)臺(tái)采購(gòu)量的商家。我們的科學(xué)家很貴的,不值得為一次性項(xiàng)目投入。”
目前市場(chǎng)上的采購(gòu)方從形態(tài)上看有貨架、冰柜、無(wú)人BOX創(chuàng)業(yè)公司,也有便利店、商超、賣(mài)場(chǎng)等傳統(tǒng)零售商,不同類(lèi)型的門(mén)店客流量不同,SKU不同,需求也千差萬(wàn)別。
無(wú)人店是市場(chǎng)上的主力買(mǎi)家,其核心需求在于離店的身份識(shí)別和收銀結(jié)算兩大項(xiàng)技術(shù),以多金、舍得砸錢(qián)給技術(shù)公司留下深刻印象。
“互聯(lián)網(wǎng)公司是資本燒錢(qián)模式,重效果,不太講成本,要上最好的設(shè)備。”一位產(chǎn)品經(jīng)理透露。
不過(guò),陳海波放出話(huà)不愿意接無(wú)人BOX的活兒。“我們調(diào)研過(guò),根本不賺錢(qián),短期內(nèi)也難以規(guī)模化開(kāi)店,中國(guó)的零售店已經(jīng)很多了,沒(méi)有那么大的市場(chǎng)空間,不是那么多地方需要。”
深蘭現(xiàn)在的業(yè)務(wù)重心在貨架和自動(dòng)販賣(mài)機(jī)的改造上:增加視覺(jué)技術(shù),即拿即走,解決盜損問(wèn)題,把它們變成貨柜或者風(fēng)幕柜,出售毛利率更高的鮮食、水果和便當(dāng)。
參考日本市場(chǎng),中國(guó)自動(dòng)販賣(mài)機(jī)的潛力還未被完全激發(fā)。而貨架相比其他零售形態(tài)與消費(fèi)者距離更短,也算進(jìn)步。但是,技術(shù)方案商們對(duì)貨架智能化節(jié)點(diǎn)是否到達(dá)的看法還不統(tǒng)一:低門(mén)檻、弱技術(shù)的貨架正忙于搶位,真的有時(shí)間和金錢(qián)顧及把自己升級(jí)為智能化產(chǎn)品?
不可否認(rèn),創(chuàng)業(yè)公司愿意嘗試新技術(shù),但技術(shù)也是它們區(qū)別于傳統(tǒng)玩家、立足市場(chǎng)的核心。簡(jiǎn)24選擇自主研發(fā),繽果盒子也發(fā)布了以視覺(jué)、傳感器、超聲波多項(xiàng)技術(shù)替代RFID的解決方案,并聲稱(chēng)已引入全球頂級(jí)人工智能專(zhuān)家,正與國(guó)內(nèi)重點(diǎn)211院校合作共建國(guó)際人工智能實(shí)驗(yàn)室。
一邊是火焰,另一邊則是冰山。
相比創(chuàng)業(yè)公司對(duì)新技術(shù)的熱情,傳統(tǒng)零售被吐槽“感興趣看看”、“掏錢(qián)欲望不強(qiáng)”。雖然此類(lèi)玩家有大把的“試驗(yàn)田”,但看過(guò)花花綠綠的PPT和demo視頻,再親自與技術(shù)提供方談一談,心便涼了。
當(dāng)然,一位曾試圖采購(gòu)視覺(jué)技術(shù)的品牌操盤(pán)手也抱怨:“幾平米地方的改造要好幾萬(wàn),還省不了一個(gè)員工,我干嘛要做?”
業(yè)內(nèi)人士介紹,目前人工智能在降低成本和提升業(yè)績(jī)上還不能發(fā)揮顯著作用,難以被零售商真正地落地采購(gòu)。原因在于,算法優(yōu)化是一個(gè)長(zhǎng)周期的、需要“活數(shù)據(jù)”的過(guò)程:先有一套標(biāo)準(zhǔn)算法,然后找場(chǎng)景落地,之后數(shù)據(jù)回流,再對(duì)回流的數(shù)據(jù)做算法的差異化訓(xùn)練。甚至有人推測(cè),整個(gè)模型跑通至少需要三年時(shí)間。
“現(xiàn)階段零售業(yè)對(duì)視覺(jué)技術(shù)的認(rèn)知還不足,預(yù)期或過(guò)高或過(guò)低,而前者占大多數(shù)。”Yi+產(chǎn)品負(fù)責(zé)人表示。
從算法模型優(yōu)化的角度講,傳統(tǒng)的連鎖商超、品牌店、便利店都是不錯(cuò)的標(biāo)的。無(wú)人店數(shù)量太少;賣(mài)場(chǎng)雖然規(guī)模大,但是洶涌的人流對(duì)機(jī)器運(yùn)算造成不小壓力。
“說(shuō)實(shí)話(huà),現(xiàn)在的項(xiàng)目是賠錢(qián)做的,我們的目的還是和客戶(hù)一起成長(zhǎng)。”一位從業(yè)者坦言。
“對(duì)于大部分AI公司來(lái)說(shuō),數(shù)據(jù)其實(shí)挺難拿的,一方面要有客戶(hù)愿意一起優(yōu)化,另一方面,投入的人力也相當(dāng)可觀(guān),需要研究人員來(lái)做單獨(dú)訓(xùn)練。“另一位業(yè)內(nèi)人士說(shuō)。
王晶表示,數(shù)據(jù)量太小的店不是早期階段最理想的案例,優(yōu)先從AI能夠帶來(lái)更大效應(yīng)的連鎖店開(kāi)始,而且線(xiàn)下門(mén)店在線(xiàn)化程度低,很多時(shí)候要重新開(kāi)始積累數(shù)據(jù)。“有的傳統(tǒng)門(mén)店P(guān)OS機(jī)版本太低,以前的數(shù)據(jù)都無(wú)法調(diào)取。”
AI公司通常被認(rèn)為核心競(jìng)爭(zhēng)點(diǎn)在于算法、數(shù)據(jù)和算力,而事實(shí)上落地能力也是重中之重。“不能忽視的是,用戶(hù)反饋機(jī)制完善度非常重要,你多久拿到用戶(hù)新的反饋,從而修改你的方法,節(jié)奏是怎么樣的,有沒(méi)有建立自動(dòng)的傳輸流程。”Yi+產(chǎn)品負(fù)責(zé)人稱(chēng)。
這也意味著AI公司搶占市場(chǎng)的速度異常重要。“如果前期用技術(shù)優(yōu)勢(shì)解決一個(gè)商家比較著急的問(wèn)題,建立起信任,然后大家一起優(yōu)化方案,如果這個(gè)流程開(kāi)始跑起來(lái),其他人進(jìn)入就比較難。”
終極目標(biāo)是分析預(yù)測(cè)
“前端獲取了數(shù)據(jù)之后的東西特別重要,可以幫助門(mén)店做銷(xiāo)量預(yù)測(cè)、選品建議、個(gè)性化營(yíng)銷(xiāo)。”王晶說(shuō)。
王晶表示,人工智能的作用不僅僅在于節(jié)省人力成本,而且可以把線(xiàn)下用戶(hù)行為轉(zhuǎn)為在線(xiàn)化的數(shù)據(jù),有了數(shù)據(jù)可以幫零售店主做更多的事情。
一位業(yè)內(nèi)人士講解道,AI的落地分為感知、理解、推理關(guān)系三個(gè)環(huán)節(jié),直到可以告訴人該怎么做的時(shí)候才是AI真正有價(jià)值的時(shí)候。
王晶說(shuō),像7-11這樣的便利店選品很大程度上依賴(lài)于店長(zhǎng)的個(gè)人經(jīng)驗(yàn),以銷(xiāo)售數(shù)據(jù)為出發(fā)點(diǎn),結(jié)合第二天的天氣和周邊環(huán)境等情況預(yù)判消費(fèi)心理并訂貨,而人工智能可以綜合更多因素做出智能化決策。
“通過(guò)攝像機(jī)等傳感器,店主可以掌握消費(fèi)者全流程的行為,消費(fèi)者從進(jìn)店起就被識(shí)別出了是誰(shuí),是不是會(huì)員,店內(nèi)看了哪些東西,對(duì)哪些產(chǎn)品感興趣,在哪個(gè)區(qū)交互多,結(jié)賬時(shí)買(mǎi)走了什么東西。”
目前,市面上的視覺(jué)方案也引入了大量客戶(hù)分析功能,比如,客戶(hù)畫(huà)像、客流統(tǒng)計(jì)、熱點(diǎn)分析、動(dòng)線(xiàn)規(guī)劃等等。
在圖普科技的一個(gè)公開(kāi)案例中,某大型餐飲連鎖每天晚上在8點(diǎn)半組織營(yíng)銷(xiāo)活動(dòng),經(jīng)過(guò)圖普科技的重新統(tǒng)計(jì)尋找人流量最高的時(shí)段,圖普科技通過(guò)數(shù)據(jù)分析發(fā)現(xiàn)8點(diǎn)30分比8點(diǎn)45分差了10%的人流,比9點(diǎn)差了15%的人流。“同樣的成本投入情況下,選錯(cuò)了最有概率出現(xiàn)最多人的時(shí)間點(diǎn),長(zhǎng)此以往會(huì)有很大損失。”圖普科技CEO李明強(qiáng)說(shuō)。
基本各家官網(wǎng)和PPT都有類(lèi)似的案例,但是也存在質(zhì)疑:這些過(guò)渡性功能一定要通過(guò)視覺(jué)技術(shù)來(lái)解決嗎?
“客流分析不是這波視覺(jué)技術(shù)帶來(lái)的,十年前就有解決方案了。”一位業(yè)內(nèi)人士坦言。
比如,大型商場(chǎng)用AP采集數(shù)據(jù),統(tǒng)計(jì)客流數(shù)量,通過(guò)MAC地址反向做人群畫(huà)像。早在2014年銀泰就推廣智能機(jī)采集用戶(hù)身份,大數(shù)據(jù)公司據(jù)此提供標(biāo)簽,從而實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo)。
此外,紅外、藍(lán)牙、雙目視頻分析都是相對(duì)成熟的信息收集手段。
百安居去年在上海使用天貓的解決方案推出了首家智慧門(mén)店,公開(kāi)信息中視覺(jué)技術(shù)中只有人臉識(shí)別,未提到對(duì)身體、動(dòng)作的識(shí)別,而據(jù)天貓電器的高級(jí)專(zhuān)家吉家在演講中透露大量使用了藍(lán)牙定位技術(shù)。“在整個(gè)接近一萬(wàn)平的場(chǎng)內(nèi)放了很多藍(lán)牙,整個(gè)過(guò)程你在哪個(gè)模塊哪個(gè)區(qū)間關(guān)注什么都可能會(huì)被記錄。”
有業(yè)內(nèi)人士表示,傳統(tǒng)方法在精度和顆粒度上不如視覺(jué)檢測(cè),但憑借低成本可能會(huì)分流走客戶(hù)。
同時(shí),現(xiàn)有視覺(jué)技術(shù)尚未給客流分析在效果上帶來(lái)質(zhì)的提升,比如,熱點(diǎn)識(shí)別可以確定某個(gè)貨架或者區(qū)域人多,但又無(wú)法落實(shí)到具體商品上面。
“現(xiàn)在核心是要把數(shù)據(jù)收集起來(lái),不在乎用的是更傳統(tǒng)的方法,還是說(shuō)更高端。”Yi+產(chǎn)品負(fù)責(zé)人指出。
當(dāng)然,視覺(jué)技術(shù)提供商也可以引入視覺(jué)以外的、已成熟的技術(shù)和產(chǎn)品。圖普科技的角色在向集成商靠攏,涉及畫(huà)像識(shí)別、滯留時(shí)長(zhǎng)、跨天跨門(mén)店回訪(fǎng)識(shí)別、軌跡追蹤、熱力圖、自定義報(bào)表、支付人臉綁定等,也有完整的產(chǎn)品形態(tài),包括web,小程序和API接口。
集成商也是計(jì)算機(jī)視覺(jué)公司的一個(gè)發(fā)展方向,否則有可能成為CRM、POS等傳統(tǒng)零售服務(wù)商的一個(gè)分支而已。不過(guò),集成商對(duì)客戶(hù)資源、整合能力要求很高,而且創(chuàng)新工場(chǎng)、阿里巴巴、騰訊等大玩家都在向其靠攏。
當(dāng)然,總體而言,線(xiàn)下零售還只是大多視覺(jué)公司撒出去的眾多種子之一,金融、醫(yī)療、汽車(chē)等諸多行業(yè)也在開(kāi)花結(jié)果,要不要真的扎根零售還沒(méi)有定論,畢竟圖普科技負(fù)責(zé)零售的產(chǎn)品和銷(xiāo)售大概二十個(gè)人,商湯的零售銷(xiāo)售只有兩人。
“現(xiàn)在是相互挑戰(zhàn)的過(guò)程,類(lèi)似商湯這樣的公司與海康之間的關(guān)系,傳統(tǒng)集成商技術(shù)上有短板,但渠道和系統(tǒng)資源有優(yōu)勢(shì)。是單項(xiàng)技術(shù)發(fā)展成面,還是面補(bǔ)足技術(shù),還挺難說(shuō)的。”一位業(yè)內(nèi)人士表示。


