如同扎克伯格在Facebook頁(yè)面上說(shuō)的,Jarvis是他個(gè)人的挑戰(zhàn),從設(shè)計(jì)的過(guò)程中他可以知道更多AI技術(shù)現(xiàn)況;他并指出,該系統(tǒng)采用了數(shù)種AI技術(shù):“包括自然語(yǔ)言處理、語(yǔ)音識(shí)別、臉部識(shí)別,以及強(qiáng)化學(xué)習(xí)(reinforcement learning);以Python、PHP與Objective C 等語(yǔ)言撰寫。”

在讀到他如何打造Jarvis時(shí),有五件事情打動(dòng)了我

20161226-Jarvis-1第一,他再次展現(xiàn)自己是個(gè)精明能干的軟件工程師。我確信有很多科技產(chǎn)業(yè)的執(zhí)行長(zhǎng)也都擁有工程教育背景,他們?cè)谥苣┮矔?huì)在地下室的工作臺(tái)上當(dāng)“修補(bǔ)工”;在兩年前我寫過(guò)當(dāng)時(shí)Marvell的執(zhí)行長(zhǎng)Sehat Sutardja,他說(shuō)他在閑暇時(shí)間開(kāi)發(fā)一種新的互連技術(shù)MoChi,而Jarvis開(kāi)發(fā)案讓我發(fā)現(xiàn)扎克伯格跟Sutardja一樣,是個(gè)大老板級(jí)的修補(bǔ)工。

第二,扎克伯格的Facebook貼文中最有趣的地方,是他的AI開(kāi)發(fā)案暴露了一些基礎(chǔ)性的問(wèn)題,不過(guò)與AI不相關(guān),是跟“聯(lián)網(wǎng)家庭”有關(guān)。對(duì)扎克伯格來(lái)說(shuō),AI反而是比較簡(jiǎn)單的部分,比他預(yù)期更復(fù)雜的是:“簡(jiǎn)單地與我家所有不同的系統(tǒng)鏈接與通信。”

所以說(shuō),甚至是在展開(kāi)AI系統(tǒng)的開(kāi)發(fā)之前,扎克伯格不得不先花好幾小時(shí)寫程序,以鏈接那些“語(yǔ)言不通”、并非采用相同通信協(xié)議的家用電器。例如扎克伯格說(shuō):

“我們的照明、恒溫器還有門,是用Crestron系統(tǒng);播放Spotify串流音樂(lè)是用Sonos系統(tǒng);有一臺(tái)三星(Samsung)電視、一臺(tái)我女兒Max用的Nest攝影機(jī),還有當(dāng)然我的工作是與Facebook的系統(tǒng)鏈接。”

他還提到:“我不得不把其中的一些API做逆向工程,甚至只為了達(dá)到我能從計(jì)算機(jī)發(fā)出指令打開(kāi)燈,或是播放某一首歌的目的。”而對(duì)我們這些不會(huì)寫程序的人來(lái)說(shuō),除非只買支持三星SmartThings、或是蘋果(Apple) HomeKit的各種家電,沒(méi)有別的辦法可以實(shí)現(xiàn)所謂的“聯(lián)網(wǎng)家庭”──但當(dāng)然,那是不會(huì)發(fā)生的!

扎克伯格還發(fā)現(xiàn)一個(gè)比各種“智能家電”不具備互操作性更大的問(wèn)題:“大多數(shù)的家電甚至還不能連結(jié)互聯(lián)網(wǎng)。”

我被他對(duì)烤面包機(jī)的討論逗笑了:“有可能采用聯(lián)網(wǎng)電力開(kāi)關(guān)來(lái)控制某些不聯(lián)網(wǎng)的家電,讓你可以在遠(yuǎn)程打開(kāi)電源,但通常這是不夠的;例如很難找到一臺(tái)烤面包機(jī),是在你把電源關(guān)閉時(shí)就讓吐司片下降,所以當(dāng)電源打開(kāi)時(shí)就能自動(dòng)開(kāi)始烤。”有解決方案嗎?最后扎克伯格找了一臺(tái)有60年歷史的烤面包機(jī)(模擬式的),并用一個(gè)聯(lián)網(wǎng)開(kāi)關(guān)來(lái)操縱它。

第三,一旦扎克伯格可以著手進(jìn)行AI系統(tǒng)開(kāi)發(fā),他實(shí)際上提供了不少實(shí)用的AI相關(guān)發(fā)現(xiàn)以及至理名言,包括:

•對(duì)任何一種AI應(yīng)用來(lái)說(shuō),了解其來(lái)龍去脈非常重要;

•扎克伯格用Facebook Messenger打造了一個(gè)Messenger機(jī)器人用來(lái)跟Jarvis溝通,如此就能用手機(jī)發(fā)訊息給Jarvis,那些訊息會(huì)立即在Jarvis服務(wù)器回放并被處理;

•文字vs.語(yǔ)音──扎克伯格發(fā)現(xiàn)自己跟Jarvis之間的溝通是文字多于語(yǔ)音;

•扎克伯格設(shè)置了一個(gè)兩階段步驟,Jarvis能識(shí)別門外訪客的人臉(首先是執(zhí)行臉部偵測(cè),看是不是有人進(jìn)入視野,接著是找到人臉并執(zhí)行臉部辨識(shí)、看訪客是誰(shuí));

•文字在與AI的溝通上,比大多數(shù)人所想象的、扮演更重要的角色,但語(yǔ)音也很實(shí)用,因?yàn)榉浅?焖伲辉瞬駥懙溃?ldquo;你不需要把手機(jī)拿起來(lái)、打開(kāi)應(yīng)用程序然后開(kāi)始打字,你只要講話就好了。”但是為了實(shí)現(xiàn)對(duì)Jarvis的語(yǔ)音控制:“我得先打造一個(gè)Jarvis專屬應(yīng)用程序,能一直聆聽(tīng)我說(shuō)的話;”Messenger機(jī)器人能在很多事情上表現(xiàn)優(yōu)異,但使用語(yǔ)音有太多磨擦。

第四,我發(fā)現(xiàn)扎克伯格最后的結(jié)論真是無(wú)價(jià),因?yàn)樗浅V甭实刂赋隽薃I技術(shù)目前的狀況:“我今年花了100個(gè)小時(shí)來(lái)打造Jarvis,現(xiàn)在我有一個(gè)相當(dāng)棒的系統(tǒng),聽(tīng)得懂我的話而且能做很多事情;但就算我再花1,000個(gè)小時(shí),我大概還是沒(méi)辦法打造一套能自己學(xué)習(xí)全新技能的系統(tǒng)──除非我能在目前的AI技術(shù)上達(dá)到某種基礎(chǔ)性的突破。”

第五,在看到Jarvis目前在扎克伯格家做的工作,我忍不住想:“就醬?”

簡(jiǎn)單來(lái)說(shuō),那些他透過(guò)聯(lián)網(wǎng)設(shè)備并教Jarvis做的事情,看來(lái)都是花了大量勞力來(lái)省力,而且就算沒(méi)有Jarvis也不是難事。我的意思是說(shuō),花了上百小時(shí)撰寫客制化程序來(lái)啟動(dòng)音頻系統(tǒng)、應(yīng)門、打開(kāi)烤面包機(jī)還有監(jiān)視嬰兒房,真的有比較快、比較有效率嗎?其實(shí)扎克伯格是不是只要花幾秒鐘就可以把他不聯(lián)網(wǎng)的尊臀從椅子上移開(kāi),然后手動(dòng)把所有那些事情都做得很好?