2014年初,Srikanth Thirumalai 見(jiàn)到了亞馬遜 CEO Jeff Bezos。Thirumalai 是一位計算機科學(xué)家,2005 年從 IBM 來(lái)到亞馬遜,負責公司的推薦團隊。他給 Bezos 提了一個(gè)全新計劃:將人工智能最新進(jìn)展結合到部門(mén)產(chǎn)品中。
他帶著(zhù)「六頁(yè)提案」去了。Bezos 很早之前就發(fā)布過(guò)一條命令,產(chǎn)品或服務(wù)推薦必須維持在這個(gè)長(cháng)度內,包含描述最終產(chǎn)品、服務(wù)和計劃的新聞稿。
當時(shí),Bezos 正依靠左右手們將亞馬遜轉型為一家人工智能「發(fā)電室」。公司很早就將人工智能技術(shù)用于產(chǎn)品推薦。不過(guò)近年來(lái),這個(gè)領(lǐng)域正在發(fā)生一場(chǎng)變革,機器學(xué)習變得越來(lái)越有效,尤其是深度學(xué)習。深度學(xué)習在計算機視覺(jué)、語(yǔ)音和自然語(yǔ)言處理方面引起了巨大的進(jìn)步。
近十年早期,雖然亞馬遜還沒(méi)有明顯利用這些技術(shù)發(fā)展,但意識到了需求的迫切性。新時(shí)代最激烈的競爭將會(huì )是 AI 領(lǐng)域。Google,Facebook,Apple 和 Microsoft 等公司都壓下巨額賭注。
亞馬遜正在落后?!肝覀兒兔總€(gè)團隊的負責人聊,基本上就是問(wèn)怎么將人工智能技術(shù)應用在自身的業(yè)務(wù)中?」亞馬遜設備和服務(wù)副總裁 David Limp 說(shuō)。
Thirumalai 走心了。他來(lái)到貝索斯的辦公室,談了談自己的年度計劃,如何更加積極地使用機器學(xué)習技術(shù)。但他又覺(jué)得,完全重構現在這套精心維護了 20 年的系統,太冒險。更何況,機器學(xué)習表現最佳的領(lǐng)域(比如圖像識別)和自己的領(lǐng)域(推薦系統)并沒(méi)啥關(guān)系。
「還沒(méi)人將深度學(xué)習技術(shù)應用在推薦中,并取得了比我們好很多的而結果?!顾f(shuō)?!杆?,特別需要信仰上的飛躍?!?/span>
Thirumalai 還沒(méi)準備好,不過(guò),Bezos 卻想要更多。
Thirumalai 想用深度學(xué)習徹底變革既有的推薦系統工作方式。但這就需要一些技術(shù),但自己團隊并沒(méi)有掌握這些技術(shù),連工具都沒(méi)有,甚至還沒(méi)人想出算法。
Bezos 卻喜歡這樣(盡管他那招牌式的笑聲并不能清楚表明,他歡迎這種做法)。于是,Thirumalai 重寫(xiě)了遍新聞稿,繼續工作去了。
公司領(lǐng)導層中,Thirumalai 是唯一一位幾年之前,拿著(zhù)「六 頁(yè)提案」跟隨 Bezos 的。
每位負責人認為,要針對不同客戶(hù)全體,提供完全不同產(chǎn)品?;旧?,這些觀(guān)點(diǎn)都算是 Thirumalai 提議的變體:使用先進(jìn)的機器學(xué)習技術(shù)改造亞馬遜部分業(yè)務(wù)。
有些建議涉及到反思既有業(yè)務(wù),比如公司的機器人、數據中心業(yè)務(wù)和亞馬遜云。有的意味著(zhù)創(chuàng )造全新業(yè)務(wù),例如語(yǔ)音智能家居產(chǎn)品,后來(lái)落地成 Echo。
但結果的影響力遠遠超過(guò)了單個(gè)業(yè)務(wù)項目。Thirumalai 說(shuō),原來(lái)開(kāi)會(huì )時(shí),公司的 AI 人才都被分割開(kāi)了?!鸽m然也會(huì )討論、交談,但不會(huì )分享大量技術(shù)和神器,因為經(jīng)驗教訓這些東西很難直接發(fā)揮作用,」他說(shuō)。這些人才就像是工程海洋中的 AI 島嶼。
但借助機器學(xué)習變革公司,徹底改變了這一現狀。
雖然每位「六頁(yè)提案」的人都在嚴格遵守亞馬遜「單線(xiàn)程(single-threaded)」團隊信條,也就是說(shuō),每個(gè)團隊「擁有」他們所采用的技術(shù),但大家開(kāi)始了跨項目協(xié)作。
公司內部科學(xué)家負責解決重大問(wèn)題,并將解決方案分享給其他團隊。AI 孤島被連接起來(lái),而且隨著(zhù)公司的 AI 雄心不斷壯大,所面臨的難題也吸引著(zhù)頂尖人才,尤其是那些想看到自己研究如何影響現實(shí)的人才。這也平衡了亞馬遜對純研究不感冒的文化,公司過(guò)去要求創(chuàng )新必須完全基于更好地為客戶(hù)服務(wù)的語(yǔ)境中。
亞馬遜龐大帝國運轉起來(lái),就像一臺永動(dòng)機。這是如何做到的?亞馬遜喜歡用「飛輪(flywheel)」這個(gè)詞作答?;跈C器學(xué)習的創(chuàng )新,會(huì )為其他業(yè)務(wù)團隊提供動(dòng)力;這些團隊通過(guò)打造產(chǎn)品和服務(wù),對其他團隊產(chǎn)生影響,甚至對整個(gè)公司產(chǎn)生影響。將公司的機器學(xué)習平臺作為一種付費服務(wù)提供給外界,這種努力本身也會(huì )帶來(lái)收益,在某些情況下,甚至能收集更多數據進(jìn)一步提升技術(shù)。
將亞馬遜從一家深度學(xué)習死忠粉公司,轉型成一家「發(fā)電室」,需要很多這樣的「六頁(yè)提案」人。整個(gè)公司,都可以看到這一轉型效果,包括運行在新的機器學(xué)習基礎架構上的推薦系統。如今,亞馬遜可以很聰明地推薦下一步讀什么、將什么商品加入購物清單,以及今晚可能想看什么電影。
今年,Thirumalai 開(kāi)啟了一項新的工作——領(lǐng)導亞馬遜的搜索部門(mén)。他希望將深度學(xué)習用于服務(wù)的各個(gè)方面。
「如果七八年之前問(wèn)我亞馬遜的 AI 實(shí)力如何,我會(huì )說(shuō),他們沒(méi)有人工智能?!谷A盛頓大學(xué)計算機科學(xué)的教授 Pedro Domingos 說(shuō),「但他們一直在積極地成長(cháng)。正成為一支勁旅?!?/span>
或許。
Alexa 效應
公司的旗艦人工智能產(chǎn)品是:Echo,以及背后的驅動(dòng)系統——Alexa 語(yǔ)音平臺。其實(shí),這些項目也源于一份 2011 年交付給 Bezos 的「六頁(yè)提案」,Operational Plan One 年度計劃。
其中一位提議高管叫 Al Lindsay,2004 年開(kāi)始在亞馬遜工作。當時(shí),他被要求從自己負責的團隊轉到主要技術(shù)團隊,幫助打造全新的產(chǎn)品。
「一款低功耗普適計算機,大腦在云端,你可以通過(guò)語(yǔ)音與它交互?!顾貞浀?。
但是,打造這樣一款科幻電影里才有的產(chǎn)品,需要具備一定的 AI 功能,但當時(shí)公司就沒(méi)有這方面的人才。雪上加霜的是,那些有技術(shù)能力的專(zhuān)家,只有極少數愿意為亞馬遜工作。Google 和 Facebook 當時(shí)也在搶奪這一領(lǐng)域的頂尖人才。
「我們當時(shí)處境很慘?!筁indsay 說(shuō)。
「亞馬遜過(guò)去形象不太好,公司對研究型人才不太友好?!笵omingos 說(shuō)。
公司對客戶(hù)不懈關(guān)注以及自身的斗士文化,與對待學(xué)術(shù)人才的態(tài)度不一致?!冈?Google 你是被寵愛(ài)的,而在亞馬遜,你的計算機則擺在衣柜上?!顾f(shuō)。
更糟糕的是,當時(shí)亞馬遜還因公司創(chuàng )新崗位還不如給公司搞包裝的崗位而「聲名遠播」。
2014 年的一次內部聚會(huì )中,機器學(xué)習領(lǐng)域頂級專(zhuān)家 Yann LeCun 在亞馬遜做了一次報告。當時(shí),他已經(jīng)接受了領(lǐng)導 Facebook 研究的橄欖枝,但他還是來(lái)做報告了。
先在一間能容納 600 人的禮堂里做報告,LeCun 回憶道,然后被帶到了一個(gè)小會(huì )議室,小團隊一個(gè)接一個(gè)來(lái)向他請教問(wèn)題。
但是當他向亞馬遜的人提問(wèn)時(shí),他們幾乎一無(wú)所應。這讓 LeCun 很無(wú)語(yǔ)。他當初選擇 Facebook,部分原因就在于后者愿意開(kāi)源大部分 AI 研究工作。
由于當時(shí)公司內部沒(méi)有相關(guān)人才,所以亞馬遜開(kāi)始巨資收購公司。
「在 Alexa 初期,我們收購了很多公司?!筁imp 說(shuō)。
2011 年年 9 月,它收購了 Yap,這是一家專(zhuān)攻語(yǔ)音文本轉換的公司。2012 年年 1 月收購了英國劍橋的 Evi,這家公司軟件可以像 Siri 一樣響應用戶(hù)的需求。2013 年 1 月收購了 Ivona,這家專(zhuān)攻語(yǔ)音合成的波蘭公司,為 Echo 提供了能夠交談的技術(shù)。
但是,亞馬遜的密保文化也妨礙了公司吸引頂尖學(xué)術(shù)人才的努力。
Alex Smola 曾經(jīng)有希望成為亞馬遜的員工,他是這個(gè)領(lǐng)域的巨星,之前在 Yahoo 和 Google 工作過(guò)。
「實(shí)際上,他也是深度學(xué)習領(lǐng)域教父之一?!笹oogle scholar 引用超過(guò)了 90000 次,亞馬遜云深度學(xué)習和人工智能部門(mén)負責人 Matt Wood 說(shuō)。
但是,亞馬遜高管甚至不向 Smola 透露他們將要從事的主要工作內容。最終 Smola 選擇了卡耐基梅隆大學(xué)的一個(gè)實(shí)驗室。
「即使到產(chǎn)品臨近推出這種關(guān)鍵時(shí)刻,我們面前也擺著(zhù)巨大的障礙。他們會(huì )嚷嚷:『我憑什么要在亞馬遜工作?我又不想向顧客銷(xiāo)售產(chǎn)品!』」Lindsay 說(shuō)道。
亞馬遜確實(shí)需要有所行動(dòng)。
既然公司是由設想中的最終產(chǎn)品倒推,那么,產(chǎn)品藍圖可能會(huì )包含某些尚未發(fā)明的功能?!秆芯靠駸嵝汀箍茖W(xué)家對這些難題興趣十足。其在語(yǔ)音方面需配備能達到對話(huà)程度的 AI,這個(gè) AI 應當能對「喚醒詞」敏感,聽(tīng)取并譯解指令,以及給出盡量合理的答案;而亞馬遜目前無(wú)法做到這一點(diǎn)。
即便沒(méi)有亞馬遜的擁躉,這個(gè)項目也吸引了 Rohit Prasad(波士頓的技術(shù)承包公司 Raytheon BBN 中的一位知名語(yǔ)音識別科學(xué)家)的注意。(這個(gè)項目使亞馬遜同意他在家鄉建立了自己的團隊。)
他認為,亞馬遜專(zhuān)業(yè)化的缺乏是一種特色而非缺陷?!高@個(gè)領(lǐng)域充滿(mǎn)希望。谷歌和微軟已經(jīng)在語(yǔ)音方面研究了很多年,而在亞馬遜,我們可以從頭開(kāi)始,抓住并解決所有難題?!?/span>
自從 2013 年加入亞馬遜以來(lái),他就被委派到了 Alexa 項目中?!高@個(gè)設備以硬件的形式存在,但在語(yǔ)音領(lǐng)域屬于早期技術(shù)?!顾f(shuō)。
Echo 最棘手的部分便是遠場(chǎng)語(yǔ)音識別,這個(gè)問(wèn)題迫使亞馬遜開(kāi)創(chuàng )了新局面,并在此過(guò)程中提升了機器學(xué)習技能。
它包括將與麥克風(fēng)存在一段距離的語(yǔ)音指令進(jìn)行譯解,甚至能夠譯解被環(huán)境噪聲或其他細聲碎語(yǔ)干擾的語(yǔ)音指令。
而具有挑戰性的一個(gè)因素,便是設備在識別指令時(shí)不能有延時(shí),它必須極快地將音頻發(fā)送至云端而后產(chǎn)生答案,使彼此之間像在進(jìn)行對話(huà),而不像處于某些「你不確定對方是否還活著(zhù)」的尷尬場(chǎng)合。
若要建立一個(gè)在嘈雜條件下能夠理解并回應對話(huà)式查詢(xún)指令的系統,則需要大量的數據,即許多人們可能與 Echo 進(jìn)行的不同類(lèi)互動(dòng)的例子。至于亞馬遜可能會(huì )從何處得到數據,目前還不可知。
設備與服務(wù)的副總裁 Limp 說(shuō)道,遠程技術(shù)早已完成,但「它建立在 Trident 潛艇的鼻錐體上,并且花費了十億美元?!箒嗰R遜試圖讓技術(shù)落地在一款可以放置在廚房柜臺上的設備中,它的價(jià)格也必須足夠低廉,才能吸引顧客購買(mǎi)這些稀奇古怪的小玩件。
「我們的團隊中,有十分之九的成員認為這無(wú)法完成。我們在亞馬遜之外有一個(gè)技術(shù)顧問(wèn)委員會(huì ),我們沒(méi)有向他們透露正在做什么,但是他們說(shuō)『不管做什么工作都不要繞過(guò)語(yǔ)音識別!』?!筆rasad 說(shuō)。
Prasad 的經(jīng)歷使他堅信這能夠做到。但亞馬遜并未提供一個(gè)能將機器學(xué)習用于產(chǎn)品開(kāi)發(fā)的可靠系統。
「好消息是,亞馬遜擁有全部必備品——無(wú)可比肩的云服務(wù),裝有 GPU 來(lái)壓縮機器學(xué)習算法的數據中心,以及知曉如何快速移動(dòng)數據的工程師?!顾f(shuō)。
他的團隊利用這些部分創(chuàng )建了一個(gè)平臺,平臺本身便是寶貴的資產(chǎn),其價(jià)值遠超出「豐富 Echo 的功能」這一使命。
「一旦我們將 Echo 開(kāi)發(fā)為遠場(chǎng)語(yǔ)音識別設備,便有機會(huì )做的更多,即將 Alexa 的范圍擴展到語(yǔ)音服務(wù)當中?!笰lexa 的資深首席科學(xué)家 Spyros Matsoukas 說(shuō)道。
這位科學(xué)家在 Raytheon BBN 公司,并與 Prasad 合作。(他的工作包括一個(gè)很小眾的 DARPA 項目,稱(chēng)為 Hub4,該項目利用廣播新聞節目和被攔截的電話(huà)內容來(lái)提升語(yǔ)音識別和自然語(yǔ)言理解能力,這是針對 Alexa 項目的一次大型訓練。)他們擴展 Alexa 的一個(gè)直接方法,便是允許第三方開(kāi)發(fā)者創(chuàng )建屬于自己的語(yǔ)音技術(shù)迷你應用程序(稱(chēng)為 skills)來(lái)運行 Echo 自身。但這僅僅是開(kāi)始。
通過(guò)將 Alexa 應用于的 Echo 設備之外,公司的人工智能文化開(kāi)始融合。整個(gè)公司的團隊開(kāi)始意識到,Alexa 也可以為他們的小項目提供有用的語(yǔ)音服務(wù)。
「盡管我們在項目負責制方面非常強,所有這些數據和技術(shù)還是要結合在一起?!筆rasad 說(shuō)。
首先,亞馬遜的其他產(chǎn)品開(kāi)始集成到 Alexa:當你在 Alexa 設備上講話(huà)時(shí),你可以訪(fǎng)問(wèn)亞馬遜音樂(lè )(Amazon Music)、Prime Video,來(lái)自亞馬遜購物網(wǎng)站的你的個(gè)人推薦和其他服務(wù)。
隨后,這項技術(shù)開(kāi)始在其他亞馬遜領(lǐng)域推廣?!敢坏┪覀冇辛嘶镜恼Z(yǔ)言能力,我們就能把它帶給非 Alexa 的產(chǎn)品,比如 Fire TV、語(yǔ)音購物、Amazon fresh 的 Dash Wand,以及最終的 AWS?!筁indsay 說(shuō)。
亞馬遜內部的人工智能小島正在逐漸聚集成洲。
一旦數百萬(wàn)用戶(hù)(亞馬遜不會(huì )確切地說(shuō)到底有多少)開(kāi)始使用 Echo 和其他一系列 Alexa 驅動(dòng)的設備,該公司轉型的另一個(gè)關(guān)鍵部分就開(kāi)始了。
亞馬遜開(kāi)始積累大量的數據,這可能是所有對話(huà)驅動(dòng)設備中最大的交互集合。這些數據成為潛在雇員的有力誘餌。突然間,亞馬遜迅速躥升成為那些它夢(mèng)寐以求的機器學(xué)習專(zhuān)家可能想要工作的地方。
「讓 Alexa 如此吸引我的原因之一是,一旦你在市場(chǎng)上有了一個(gè)設備,你就有了反饋的資源。不僅是客戶(hù)的反饋,而且是真正的數據,對于改善一切——尤其是底層平臺——是如此重要?!谷ツ昙尤雭嗰R遜的一位 Alexa 機器學(xué)習副總裁 Ravi Jain 說(shuō)。
因此,隨著(zhù)越來(lái)越多的人使用 Alexa,亞馬遜得到的信息不僅使該系統性能更好,而且還加強了自己的機器學(xué)習工具和平臺,并使這家公司成為機器學(xué)習科學(xué)家的一個(gè)更熱門(mén)的目的地。
飛輪正開(kāi)始旋轉。
一個(gè)更具智慧的云端
亞馬遜在 2014 年開(kāi)始向高端客戶(hù)銷(xiāo)售 Echo;而同年,Swami Sivasubramanian 對機器學(xué)習入了迷。
當時(shí)正在管理 AWS 數據庫及分析業(yè)務(wù)的 Sivasubramanian 正和家人在印度旅行,在時(shí)差和思維千奇百怪的女兒的混合「打擊」下,他開(kāi)始深夜在電腦前研究谷歌的 Tensorflow 和 Caffé這樣的工具,而它們恰恰是 Facebook 和許多學(xué)者青睞的機器學(xué)習框架。
他總結道,將這些工具與亞馬遜的云服務(wù)相結合可能會(huì )產(chǎn)生巨大的價(jià)值。他使機器學(xué)習算法在云端易于運行后,認為公司可能會(huì )進(jìn)入潛在需求所組成的脈絡(luò )。
「我們每月能夠為數百萬(wàn)開(kāi)發(fā)者提供服務(wù),其中大多數都沒(méi)有機器學(xué)習背景,而不是麻省理工學(xué)院的教授?!顾f(shuō)道。
之后 Jeff Bezos 評論道,他帶著(zhù)史詩(shī)般的六頁(yè)提案,氣宇軒昂而來(lái)。
從某層面而言,它是向 AWS 增添機器學(xué)習服務(wù)的藍圖;而 Sivasubramanian 卻看的更遠:這是使 AWS 成為所有科技領(lǐng)域機器學(xué)習活動(dòng)活躍中心的宏偉愿景。
從某種意義上而言,向數萬(wàn)亞馬遜的云客戶(hù)提供機器學(xué)習是不可避免的。
「當我們首次將 AWS 的初始商業(yè)計劃整合到一起時(shí),其任務(wù)便是,采用只有少數資金雄厚的組織才能實(shí)現的技術(shù),并使其分布盡量廣泛。我們在計算、存儲、分析與數據庫方面取得了成功,并且正利用機器學(xué)習,采取了完全相同的方法?!笰WS 的機器學(xué)習經(jīng)理 Wood 說(shuō)道。
而能夠吸取公司在其他方面所積累的經(jīng)驗,則是使 AWS 更加順風(fēng)順水的一大法寶。
Wood 說(shuō),AWS 在 2015 年首次推出的 Amazon Machine Learning 使像 C-Span 這樣的客戶(hù)能夠建立私人面部目錄;Zillow 用來(lái)估算房?jì)r(jià),Pinterest 則用于虛擬搜索,并且有幾家自動(dòng)駕駛的初創(chuàng )公司正應用 AWS 的機器學(xué)習,通過(guò)數百萬(wàn)英里的模擬道路測試來(lái)改進(jìn)產(chǎn)品。
2016 年,AWS 推出了新的機器學(xué)習服務(wù),一個(gè)名為 Polly 的文本到語(yǔ)音組件,以及一個(gè)名為 Lex 的自然語(yǔ)言處理引擎——它們更直接地利用了 Alexa 的創(chuàng )新。
這些產(chǎn)品幫助 AWS 的客戶(hù)們建立自己的迷你 Alexa,從 Pinterest 和 Netflix 等巨頭到小型初創(chuàng )公司都可以輕松完成。
涉及視覺(jué)的第三項服務(wù) Rekognition 利用在亞馬遜一個(gè)相對不太出名的團隊 Prime Photos 完成的工作,這個(gè)團隊試圖實(shí)現谷歌、Facebook 和蘋(píng)果的照片產(chǎn)品中同樣的深度學(xué)習功能。
這些機器學(xué)習服務(wù)既是強大的收入來(lái)源,也是亞馬遜人工智能飛輪的關(guān)鍵,因為諸如美國國家航空航天局(NASA)和美國國家橄欖球聯(lián)盟(NFL)這樣的來(lái)自各界的客戶(hù)都在花錢(qián)讓他們的機器從亞馬遜的數據中學(xué)習。
當這些公司能在 AWS 內部建立他們的重要機器學(xué)習工具時(shí),他們轉移到競爭對手的云運算平臺的可能性就變得微乎其微了。(真是抱歉了,谷歌、微軟、或者 IBM)
看看 Infor,這是一家為企業(yè)客戶(hù)創(chuàng )建業(yè)務(wù)應用程序的價(jià)值數十億美元的公司。最近,它發(fā)布了一個(gè)名為 Coleman(以電影 Hidden Figures 里 NASA 數學(xué)家的名字命名)的大規模新應用程序,它允許客戶(hù)僅通過(guò)對話(huà)界面來(lái)自動(dòng)化各種過(guò)程、分析公司表現,以及與數據進(jìn)行交互。它并沒(méi)有從頭構建自己的程序,而是使用了 AWS 的 Lex 技術(shù)。
「無(wú)論如何,亞馬遜都在做這個(gè)方面的研究,那么我們?yōu)槭裁匆谶@上面花時(shí)間呢?我們了解我們的客戶(hù),可以讓?xiě)贸绦蚋m合他們使用?!笽nfor 的高級副總裁 Massimo Capoccia 如是說(shuō)。
AWS 在以太領(lǐng)域的主導地位也使其在戰略上優(yōu)于競爭對手,尤其是谷歌,該公司曾希望利用其機器學(xué)習的領(lǐng)導力,在云計算領(lǐng)域趕上 AWS。是的,谷歌可以在服務(wù)器上為客戶(hù)提供超快、機器學(xué)習優(yōu)化的芯片,但是 AWS 上的公司可以更容易地與那些也在服務(wù)的公司進(jìn)行互動(dòng)和銷(xiāo)售。
「就像 Willie Sutton 說(shuō)他搶銀行是因為錢(qián)就在那里一樣,」DigitalGlobe 公司的 CTO Walter Scott 在談到他的公司為什么使用亞馬遜的技術(shù)時(shí)說(shuō),「我們使用 AWS 進(jìn)行機器學(xué)習,因為這是我們的客戶(hù)所在?!?/span>
去年 11 月,在 AWS 的 re:Invent 會(huì )議上,亞馬遜為其客戶(hù)推出了一個(gè)更全面的機器學(xué)習外延輔助工具:SageMaker,這是一個(gè)復雜但超級易用的平臺。
它的創(chuàng )造者之一正是 Alex Smola,他是機器學(xué)習領(lǐng)域的超級明星,有超過(guò) 9 萬(wàn)次學(xué)術(shù)引用,在五年前曾拒絕了亞馬遜的工作邀請。當 Smola 決定重返行業(yè)時(shí),他想要幫助創(chuàng )建強大的工具,讓日常軟件開(kāi)發(fā)人員能夠訪(fǎng)用上機器學(xué)習。所以他去了他認為能讓他產(chǎn)生最大影響力的地方。
「亞馬遜太好了,不能放棄,」他說(shuō),「你可以寫(xiě)一篇關(guān)于某個(gè)問(wèn)題的論文,但如果你不去實(shí)現它,就沒(méi)人會(huì )真的用你那漂亮的算法?!?/span>
當 Smola 告訴 Sivasubramanian,構建能夠將機器學(xué)習傳播給數百萬(wàn)人的工具比發(fā)布再多一篇論文更重要時(shí),他得到了一個(gè)驚喜。
「你也可以發(fā)表你的論文!」Sivasubramanian 說(shuō)。
是的,亞馬遜如今在允許其科學(xué)家發(fā)表文章方面更加自由?!高@對招募頂尖人才有很大幫助,同時(shí)也為亞馬遜的研究提供了可看性,」幫助制定了更開(kāi)放立場(chǎng)指南的 Spyros Matsoukas 說(shuō)。
要想知道 AWS 的一百多萬(wàn)用戶(hù)是否會(huì )開(kāi)始使用 SageMaker 將機器學(xué)習應用到他們的產(chǎn)品中,現在還為時(shí)過(guò)早。但是每一個(gè)做過(guò)的客戶(hù)都會(huì )發(fā)現自己在亞馬遜上投入良多。
此外,該平臺非常復雜,甚至包括 Alexa 團隊在內的亞馬遜內部人工智能團隊都表示,他們打算成為 SageMaker 客戶(hù),使用這個(gè)本是提供給外部人員的工具。
他們相信,通過(guò)為他們的項目設立一個(gè)基礎,讓他們能夠專(zhuān)注于更高級的算法任務(wù),這將為他們節省大量的工作。
即使只有 AWS 的部分客戶(hù)使用了 SageMaker,亞馬遜也會(huì )發(fā)現自己的系統性能數據豐富許多(當然,這不包括客戶(hù)自己的機密信息)。這將帶來(lái)更好的算法、更好的平臺,和更多的客戶(hù)。飛輪正在加班加點(diǎn)地工作。
人工智能無(wú)處不在
隨著(zhù)機器學(xué)習的徹底改革,該公司的人工智能技術(shù)已經(jīng)遍布了許多團隊,這讓 Bezos 和他的助手們非常滿(mǎn)意。
雖然在亞馬遜沒(méi)有人工智能的中心辦公室,但的確有一個(gè)部門(mén)專(zhuān)門(mén)負責機器學(xué)習以及一些將新科學(xué)推進(jìn)公司項目的應用研究的推廣和支持。
核心機器學(xué)習小組由 Ralf Herbrich 領(lǐng)導,在 2012 年被亞馬遜引入之前,他曾在微軟的 Bing 團隊工作,然后在 Facebook 工作了一年。
他說(shuō),在公司內部「有一個(gè)擁有這個(gè)社區的地方是很重要的?!梗ó斎?,這支團隊的任務(wù)歸納在了一份 Bezos 批準的充滿(mǎn)抱負的六頁(yè)提案上。)
他的部分職責包括培育亞馬遜快速增長(cháng)的機器學(xué)習文化。由于該公司以客戶(hù)為中心的思路——解決問(wèn)題而不是進(jìn)行理論研究——亞馬遜的高管們承認,他們的招聘工作總是傾向于那些對構建新事物感興趣的人,而不是那些追求科學(xué)突破的人。
Facebook 的 LeCun 則以另一種方式表達了同樣觀(guān)點(diǎn):「你即使不領(lǐng)導知識的先鋒,也可以做得很好?!?/span>
但亞馬遜也在跟隨 Facebook 和谷歌的領(lǐng)導,培訓其員工在人工智能方面更加熟稔。它開(kāi)設了關(guān)于機器學(xué)習策略的內部課程,主辦了一系列內部專(zhuān)家的講座。從 2013 年開(kāi)始,該公司每年春天都會(huì )在其總部舉辦一場(chǎng)內部機器學(xué)習會(huì )議,這是一種亞馬遜內部版的 NIPS,NIPS 是最重要的學(xué)術(shù)機器學(xué)習平臺。
「剛開(kāi)始的時(shí)候,亞馬遜的機器學(xué)習會(huì )議只有幾百人,而現在已經(jīng)有成千上萬(wàn)的人了,」Herbrich 說(shuō)。
「我們在西雅圖最大的會(huì )議室容量也不夠,所以我們把在那里舉辦,然后在園區里的其他 6 個(gè)會(huì )議室直播?!箒嗰R遜的一名高管說(shuō),如果它變得更大,而不是把它稱(chēng)為一個(gè)亞馬遜的機器學(xué)習活動(dòng),而可以被稱(chēng)為亞馬遜本身了。
Herbrich 的團隊繼續將機器學(xué)習推進(jìn)到公司的一切新業(yè)務(wù)。
例如,執行團隊想要更好地預測在某一客戶(hù)的訂單中應該選取 8 個(gè)可選盒子尺寸中的哪一個(gè)時(shí),他們求助于 Herbrich 的團隊。
「那個(gè)實(shí)現團隊不需要有自己的科學(xué)團隊,但它需要這些算法,并且需要能夠很容易地使用它們?!顾f(shuō)。
在另一個(gè)例子中,David Limp 指出了亞馬遜對有多少客戶(hù)可能會(huì )購買(mǎi)新產(chǎn)品的預測方法的轉變?!肝乙呀?jīng)在消費電子產(chǎn)品領(lǐng)域工作了 30 年,其中有 25 年的預測都是用(人類(lèi)的)判斷、電子表格和一些魔術(shù)球和飛鏢做的?!顾f(shuō),「自從我們開(kāi)始用機器學(xué)習來(lái)進(jìn)行預測,我們的錯誤率明顯地下降了?!?/span>
不過(guò),有時(shí)候 Herbrich 的團隊還是會(huì )將尖端科學(xué)應用到一個(gè)問(wèn)題上。
該公司的雜貨遞送服務(wù) Amazon Fresh 已經(jīng)運營(yíng)了 10 年,但它需要一種更好的方式來(lái)評估水果和蔬菜的質(zhì)量——人類(lèi)的速度太慢且標準不一致。他在柏林的團隊建立了滿(mǎn)是傳感器的硬件和新的算法,為系統加入了觸摸和聞到食物的能力。
「三年后,我們到達了一個(gè)原型機階段,可以(比以前)更可靠地判斷質(zhì)量」。
當然,這樣的進(jìn)步會(huì )滲透到整個(gè)亞馬遜生態(tài)系統中。
以 Amazon Go 為例,這是一家位于其總部大樓內剛剛開(kāi)始向公眾開(kāi)放的、以深度學(xué)習為動(dòng)力的無(wú)人收銀雜貨店?!缸鳛?AWS 的客戶(hù),我們受益于它的規模,」Amazon Go 的技術(shù)副總裁 Dilip Kumar 說(shuō),「但 AWS 也同樣是個(gè)受益者?!?/span>
他舉了 Amazon Go 獨特的流媒體數據系統的例子,該系統通過(guò)數百臺攝像機記錄顧客的購物活動(dòng)。他的團隊所策劃的創(chuàng )新幫助影響了一項稱(chēng)為「Kinesis」的 AWS 服務(wù),該服務(wù)讓用戶(hù)將視頻從多個(gè)設備傳送到亞馬遜云,在那里他們可以處理、分析和使用它來(lái)進(jìn)一步推進(jìn)他們的機器學(xué)習。
即使亞馬遜的某項服務(wù)尚未使用公司的機器學(xué)習平臺,它也可以成為這個(gè)過(guò)程的積極參與者。
亞馬遜的 Prime Air 無(wú)人機送貨服務(wù)仍處于原型階段,它必須單獨構建人工智能,因為無(wú)人機無(wú)法依靠云端來(lái)計算。但它仍能從飛輪上獲得巨大的收益,無(wú)論是從公司的其他方面獲取知識,還是弄清楚使用什么工具。
「我們認為這是一個(gè)菜單——每個(gè)人都在分享他們能提供的菜肴,」Prime Air 副總裁 Gur Kimchi 說(shuō)。他預計,他的團隊最終將擁有自己的美味菜單。
「我們的經(jīng)驗教訓和我們在 Prime Air 上解決的問(wèn)題無(wú)疑是對亞馬遜的其他團隊來(lái)說(shuō)有用的?!?/span>
事實(shí)上,這似乎已經(jīng)發(fā)生了。
「如果有人在公司的某個(gè)部門(mén)(比如 Prime Air 或 Amazon Go)看一幅圖片,他們學(xué)到了一些東西,并創(chuàng )造出一種算法,他們就會(huì )和公司里的其他人討論這個(gè)問(wèn)題。于是,我的團隊中的某個(gè)人也可以使用它,比如說(shuō),弄清楚一個(gè)在在執行中心移動(dòng)的產(chǎn)品的圖像里有什么?!箒嗰R遜機器人(Amazon robotics)的首席科學(xué)家 Beth Marcus 說(shuō)。
之后 Jeff Bezos 評論道,他帶著(zhù)史詩(shī)般的六頁(yè)提案,氣宇軒昂而來(lái)。
從某層面而言,它是向 AWS 增添機器學(xué)習服務(wù)的藍圖;而 Sivasubramanian 卻看的更遠:這是使 AWS 成為所有科技領(lǐng)域機器學(xué)習活動(dòng)活躍中心的宏偉愿景。
從某種意義上而言,向數萬(wàn)亞馬遜的云客戶(hù)提供機器學(xué)習是不可避免的。
「當我們首次將 AWS 的初始商業(yè)計劃整合到一起時(shí),其任務(wù)便是,采用只有少數資金雄厚的組織才能實(shí)現的技術(shù),并使其分布盡量廣泛。我們在計算、存儲、分析與數據庫方面取得了成功,并且正利用機器學(xué)習,采取了完全相同的方法?!笰WS 的機器學(xué)習經(jīng)理 Wood 說(shuō)道。
而能夠吸取公司在其他方面所積累的經(jīng)驗,則是使 AWS 更加順風(fēng)順水的一大法寶。
Wood 說(shuō),AWS 在 2015 年首次推出的 Amazon Machine Learning 使像 C-Span 這樣的客戶(hù)能夠建立私人面部目錄;Zillow 用來(lái)估算房?jì)r(jià),Pinterest 則用于虛擬搜索,并且有幾家自動(dòng)駕駛的初創(chuàng )公司正應用 AWS 的機器學(xué)習,通過(guò)數百萬(wàn)英里的模擬道路測試來(lái)改進(jìn)產(chǎn)品。
2016 年,AWS 推出了新的機器學(xué)習服務(wù),一個(gè)名為 Polly 的文本到語(yǔ)音組件,以及一個(gè)名為 Lex 的自然語(yǔ)言處理引擎——它們更直接地利用了 Alexa 的創(chuàng )新。
這些產(chǎn)品幫助 AWS 的客戶(hù)們建立自己的迷你 Alexa,從 Pinterest 和 Netflix 等巨頭到小型初創(chuàng )公司都可以輕松完成。
涉及視覺(jué)的第三項服務(wù) Rekognition 利用在亞馬遜一個(gè)相對不太出名的團隊 Prime Photos 完成的工作,這個(gè)團隊試圖實(shí)現谷歌、Facebook 和蘋(píng)果的照片產(chǎn)品中同樣的深度學(xué)習功能。
這些機器學(xué)習服務(wù)既是強大的收入來(lái)源,也是亞馬遜人工智能飛輪的關(guān)鍵,因為諸如美國國家航空航天局(NASA)和美國國家橄欖球聯(lián)盟(NFL)這樣的來(lái)自各界的客戶(hù)都在花錢(qián)讓他們的機器從亞馬遜的數據中學(xué)習。
當這些公司能在 AWS 內部建立他們的重要機器學(xué)習工具時(shí),他們轉移到競爭對手的云運算平臺的可能性就變得微乎其微了。(真是抱歉了,谷歌、微軟、或者 IBM)
看看 Infor,這是一家為企業(yè)客戶(hù)創(chuàng )建業(yè)務(wù)應用程序的價(jià)值數十億美元的公司。最近,它發(fā)布了一個(gè)名為 Coleman(以電影 Hidden Figures 里 NASA 數學(xué)家的名字命名)的大規模新應用程序,它允許客戶(hù)僅通過(guò)對話(huà)界面來(lái)自動(dòng)化各種過(guò)程、分析公司表現,以及與數據進(jìn)行交互。它并沒(méi)有從頭構建自己的程序,而是使用了 AWS 的 Lex 技術(shù)。
「無(wú)論如何,亞馬遜都在做這個(gè)方面的研究,那么我們?yōu)槭裁匆谶@上面花時(shí)間呢?我們了解我們的客戶(hù),可以讓?xiě)贸绦蚋m合他們使用?!笽nfor 的高級副總裁 Massimo Capoccia 如是說(shuō)。
AWS 在以太領(lǐng)域的主導地位也使其在戰略上優(yōu)于競爭對手,尤其是谷歌,該公司曾希望利用其機器學(xué)習的領(lǐng)導力,在云計算領(lǐng)域趕上 AWS。是的,谷歌可以在服務(wù)器上為客戶(hù)提供超快、機器學(xué)習優(yōu)化的芯片,但是 AWS 上的公司可以更容易地與那些也在服務(wù)的公司進(jìn)行互動(dòng)和銷(xiāo)售。
「就像 Willie Sutton 說(shuō)他搶銀行是因為錢(qián)就在那里一樣,」DigitalGlobe 公司的 CTO Walter Scott 在談到他的公司為什么使用亞馬遜的技術(shù)時(shí)說(shuō),「我們使用 AWS 進(jìn)行機器學(xué)習,因為這是我們的客戶(hù)所在?!?/span>
去年 11 月,在 AWS 的 re:Invent 會(huì )議上,亞馬遜為其客戶(hù)推出了一個(gè)更全面的機器學(xué)習外延輔助工具:SageMaker,這是一個(gè)復雜但超級易用的平臺。
它的創(chuàng )造者之一正是 Alex Smola,他是機器學(xué)習領(lǐng)域的超級明星,有超過(guò) 9 萬(wàn)次學(xué)術(shù)引用,在五年前曾拒絕了亞馬遜的工作邀請。當 Smola 決定重返行業(yè)時(shí),他想要幫助創(chuàng )建強大的工具,讓日常軟件開(kāi)發(fā)人員能夠訪(fǎng)用上機器學(xué)習。所以他去了他認為能讓他產(chǎn)生最大影響力的地方。
「亞馬遜太好了,不能放棄,」他說(shuō),「你可以寫(xiě)一篇關(guān)于某個(gè)問(wèn)題的論文,但如果你不去實(shí)現它,就沒(méi)人會(huì )真的用你那漂亮的算法?!?/span>
當 Smola 告訴 Sivasubramanian,構建能夠將機器學(xué)習傳播給數百萬(wàn)人的工具比發(fā)布再多一篇論文更重要時(shí),他得到了一個(gè)驚喜。
「你也可以發(fā)表你的論文!」Sivasubramanian 說(shuō)。
是的,亞馬遜如今在允許其科學(xué)家發(fā)表文章方面更加自由?!高@對招募頂尖人才有很大幫助,同時(shí)也為亞馬遜的研究提供了可看性,」幫助制定了更開(kāi)放立場(chǎng)指南的 Spyros Matsoukas 說(shuō)。
要想知道 AWS 的一百多萬(wàn)用戶(hù)是否會(huì )開(kāi)始使用 SageMaker 將機器學(xué)習應用到他們的產(chǎn)品中,現在還為時(shí)過(guò)早。但是每一個(gè)做過(guò)的客戶(hù)都會(huì )發(fā)現自己在亞馬遜上投入良多。
此外,該平臺非常復雜,甚至包括 Alexa 團隊在內的亞馬遜內部人工智能團隊都表示,他們打算成為 SageMaker 客戶(hù),使用這個(gè)本是提供給外部人員的工具。
他們相信,通過(guò)為他們的項目設立一個(gè)基礎,讓他們能夠專(zhuān)注于更高級的算法任務(wù),這將為他們節省大量的工作。
即使只有 AWS 的部分客戶(hù)使用了 SageMaker,亞馬遜也會(huì )發(fā)現自己的系統性能數據豐富許多(當然,這不包括客戶(hù)自己的機密信息)。這將帶來(lái)更好的算法、更好的平臺,和更多的客戶(hù)。飛輪正在加班加點(diǎn)地工作。
人工智能無(wú)處不在
隨著(zhù)機器學(xué)習的徹底改革,該公司的人工智能技術(shù)已經(jīng)遍布了許多團隊,這讓 Bezos 和他的助手們非常滿(mǎn)意。
雖然在亞馬遜沒(méi)有人工智能的中心辦公室,但的確有一個(gè)部門(mén)專(zhuān)門(mén)負責機器學(xué)習以及一些將新科學(xué)推進(jìn)公司項目的應用研究的推廣和支持。
核心機器學(xué)習小組由 Ralf Herbrich 領(lǐng)導,在 2012 年被亞馬遜引入之前,他曾在微軟的 Bing 團隊工作,然后在 Facebook 工作了一年。
他說(shuō),在公司內部「有一個(gè)擁有這個(gè)社區的地方是很重要的?!梗ó斎?,這支團隊的任務(wù)歸納在了一份 Bezos 批準的充滿(mǎn)抱負的六頁(yè)提案上。)
他的部分職責包括培育亞馬遜快速增長(cháng)的機器學(xué)習文化。由于該公司以客戶(hù)為中心的思路——解決問(wèn)題而不是進(jìn)行理論研究——亞馬遜的高管們承認,他們的招聘工作總是傾向于那些對構建新事物感興趣的人,而不是那些追求科學(xué)突破的人。
Facebook 的 LeCun 則以另一種方式表達了同樣觀(guān)點(diǎn):「你即使不領(lǐng)導知識的先鋒,也可以做得很好?!?/span>
但亞馬遜也在跟隨 Facebook 和谷歌的領(lǐng)導,培訓其員工在人工智能方面更加熟稔。它開(kāi)設了關(guān)于機器學(xué)習策略的內部課程,主辦了一系列內部專(zhuān)家的講座。從 2013 年開(kāi)始,該公司每年春天都會(huì )在其總部舉辦一場(chǎng)內部機器學(xué)習會(huì )議,這是一種亞馬遜內部版的 NIPS,NIPS 是最重要的學(xué)術(shù)機器學(xué)習平臺。
「剛開(kāi)始的時(shí)候,亞馬遜的機器學(xué)習會(huì )議只有幾百人,而現在已經(jīng)有成千上萬(wàn)的人了,」Herbrich 說(shuō)。
「我們在西雅圖最大的會(huì )議室容量也不夠,所以我們把在那里舉辦,然后在園區里的其他 6 個(gè)會(huì )議室直播?!箒嗰R遜的一名高管說(shuō),如果它變得更大,而不是把它稱(chēng)為一個(gè)亞馬遜的機器學(xué)習活動(dòng),而可以被稱(chēng)為亞馬遜本身了。
Herbrich 的團隊繼續將機器學(xué)習推進(jìn)到公司的一切新業(yè)務(wù)。
例如,執行團隊想要更好地預測在某一客戶(hù)的訂單中應該選取 8 個(gè)可選盒子尺寸中的哪一個(gè)時(shí),他們求助于 Herbrich 的團隊。
「那個(gè)實(shí)現團隊不需要有自己的科學(xué)團隊,但它需要這些算法,并且需要能夠很容易地使用它們?!顾f(shuō)。
在另一個(gè)例子中,David Limp 指出了亞馬遜對有多少客戶(hù)可能會(huì )購買(mǎi)新產(chǎn)品的預測方法的轉變?!肝乙呀?jīng)在消費電子產(chǎn)品領(lǐng)域工作了 30 年,其中有 25 年的預測都是用(人類(lèi)的)判斷、電子表格和一些魔術(shù)球和飛鏢做的?!顾f(shuō),「自從我們開(kāi)始用機器學(xué)習來(lái)進(jìn)行預測,我們的錯誤率明顯地下降了?!?/span>
不過(guò),有時(shí)候 Herbrich 的團隊還是會(huì )將尖端科學(xué)應用到一個(gè)問(wèn)題上。
該公司的雜貨遞送服務(wù) Amazon Fresh 已經(jīng)運營(yíng)了 10 年,但它需要一種更好的方式來(lái)評估水果和蔬菜的質(zhì)量——人類(lèi)的速度太慢且標準不一致。他在柏林的團隊建立了滿(mǎn)是傳感器的硬件和新的算法,為系統加入了觸摸和聞到食物的能力。
「三年后,我們到達了一個(gè)原型機階段,可以(比以前)更可靠地判斷質(zhì)量」。
當然,這樣的進(jìn)步會(huì )滲透到整個(gè)亞馬遜生態(tài)系統中。
以 Amazon Go 為例,這是一家位于其總部大樓內剛剛開(kāi)始向公眾開(kāi)放的、以深度學(xué)習為動(dòng)力的無(wú)人收銀雜貨店?!缸鳛?AWS 的客戶(hù),我們受益于它的規模,」Amazon Go 的技術(shù)副總裁 Dilip Kumar 說(shuō),「但 AWS 也同樣是個(gè)受益者?!?/span>
他舉了 Amazon Go 獨特的流媒體數據系統的例子,該系統通過(guò)數百臺攝像機記錄顧客的購物活動(dòng)。他的團隊所策劃的創(chuàng )新幫助影響了一項稱(chēng)為「Kinesis」的 AWS 服務(wù),該服務(wù)讓用戶(hù)將視頻從多個(gè)設備傳送到亞馬遜云,在那里他們可以處理、分析和使用它來(lái)進(jìn)一步推進(jìn)他們的機器學(xué)習。
即使亞馬遜的某項服務(wù)尚未使用公司的機器學(xué)習平臺,它也可以成為這個(gè)過(guò)程的積極參與者。
亞馬遜的 Prime Air 無(wú)人機送貨服務(wù)仍處于原型階段,它必須單獨構建人工智能,因為無(wú)人機無(wú)法依靠云端來(lái)計算。但它仍能從飛輪上獲得巨大的收益,無(wú)論是從公司的其他方面獲取知識,還是弄清楚使用什么工具。
「我們認為這是一個(gè)菜單——每個(gè)人都在分享他們能提供的菜肴,」Prime Air 副總裁 Gur Kimchi 說(shuō)。他預計,他的團隊最終將擁有自己的美味菜單。
「我們的經(jīng)驗教訓和我們在 Prime Air 上解決的問(wèn)題無(wú)疑是對亞馬遜的其他團隊來(lái)說(shuō)有用的?!?/span>
事實(shí)上,這似乎已經(jīng)發(fā)生了。
「如果有人在公司的某個(gè)部門(mén)(比如 Prime Air 或 Amazon Go)看一幅圖片,他們學(xué)到了一些東西,并創(chuàng )造出一種算法,他們就會(huì )和公司里的其他人討論這個(gè)問(wèn)題。于是,我的團隊中的某個(gè)人也可以使用它,比如說(shuō),弄清楚一個(gè)在在執行中心移動(dòng)的產(chǎn)品的圖像里有什么?!箒嗰R遜機器人(Amazon robotics)的首席科學(xué)家 Beth Marcus 說(shuō)。
一個(gè)以產(chǎn)品為中心的公司是否有可能超越滿(mǎn)是深度學(xué)習超級明星的競爭對手?
亞馬遜正為這個(gè)問(wèn)題提供一個(gè)案例。
「雖然他們正在努力趕上,但他們發(fā)布的產(chǎn)品卻令人印象深刻,」艾倫人工智能研究所 (Allen Institute for Artificial Intelligence) 的首席執行官 Oren Etzioni 說(shuō),「他們是世界級的公司,他們創(chuàng )造了世界級的人工智能產(chǎn)品?!?/span>
飛輪一直在旋轉,我們尚未看到很多正在準備中的「六頁(yè)提案」的影響。但是,更多的數據,意味著(zhù)更多的顧客。更好的平臺,意味著(zhù)更多的人才。
「 Alexa,亞馬遜在人工智能領(lǐng)域現在做得怎么樣?」
回答么?就是 Jeff Bezos 尖尖的笑聲了。
評論
全部評論(341)
-
最新最熱
行業(yè)資訊 -
訂閱欄目
效率閱讀 -
音頻新聞
通勤最?lèi)?ài)