曾記得十幾天之前否?那時(shí)我們躊躇滿(mǎn)志的跨進(jìn)了2018,滿(mǎn)懷著(zhù)對未來(lái)的渴望,然后我們驚奇地發(fā)現,2018第一個(gè)火起來(lái)的詞叫“撒幣”…...
不是我說(shuō)啥,這可真出戲啊。
似乎一夜之間,直播答題和這個(gè)叫做”撒幣”的關(guān)鍵詞就火了。王思聰的沖頂大會(huì )、映客的芝士超人、花椒的百萬(wàn)贏(yíng)家,一時(shí)之間大佬們瘋狂爭當“大撒幣”,人民群眾則紛紛出頭想當被幣砸到的那個(gè)幸運兒。
當然了,不管這些平臺們如何“撒”,最終“幣”還是要回到他們自己口袋里的,畢竟做生意是為了賺錢(qián),搞出來(lái)這么大場(chǎng)面當然是為了放后招,沒(méi)聽(tīng)說(shuō)過(guò)哪位出題讓人答是為了做慈善的。除非來(lái)答題的是個(gè)AI,說(shuō)不定能干到王思聰、周鴻祎們沒(méi)幣可撒......
畢竟,答題也是講科學(xué)的對不對?
AI答題這件事其實(shí)也不新鮮,不信你百度輸入一個(gè)“長(cháng)城有多長(cháng)”之類(lèi)的問(wèn)題,馬上就會(huì )給你找出來(lái)答案。這里就是用了AI的專(zhuān)業(yè)答題“姿勢”:知識圖譜。
借著(zhù)直播答題的春風(fēng),今天我們來(lái)講講知識圖譜吧。雖然在機器視覺(jué)、語(yǔ)音交互等“網(wǎng)紅技術(shù)”面前,作為AI重要分支之一的知識圖譜似乎不那么出位。但是以應用程度和腦洞指數來(lái)說(shuō),這個(gè)技術(shù)絕對當仁不讓。更重要的是,在“AI感知”通向“AI理解”的大路上,知識圖譜近乎是無(wú)法繞開(kāi)的一道關(guān)卡。
更更重要的是,它能幫你答題啊……
知識圖譜是什么?
知識圖譜這個(gè)概念的提出時(shí)間并不算太久,但是要追根溯源理解這個(gè)技術(shù)到底是玩什么的,那可能真要往上倒騰幾十年才行。
上世紀40年代,人工智能被提出之后,無(wú)數科學(xué)家們就開(kāi)始琢磨,到底用什么方式能讓機器模擬出人的智慧呢?琢磨來(lái)琢磨去,人對于信息能夠進(jìn)行關(guān)聯(lián)理解似乎是個(gè)路子。所謂信息關(guān)聯(lián),就是人類(lèi)在接受一個(gè)信息后,會(huì )把它放在記憶中進(jìn)行歸納和調用。比如說(shuō)你打小認識了你三舅,絕不可能過(guò)幾年管他叫二哥......
利用這個(gè)思路,上世紀50年代末,學(xué)術(shù)界提出了語(yǔ)義網(wǎng)絡(luò )(semantic network)的設想,打算把數據進(jìn)行結構化的處理,讓單個(gè)信息組合成有聯(lián)系、能共鳴的“知識”。今天我們用到的很多技術(shù)都來(lái)源于語(yǔ)義網(wǎng)絡(luò ),比如機器翻譯、自然語(yǔ)言處理等等,知識圖譜也是其中之一。
上世紀80年代,受到多方面刺激的地球人開(kāi)始了一次AI復興運動(dòng),而這次運動(dòng)的主角,就是各國開(kāi)始打造專(zhuān)家系統和知識庫。那時(shí)候科學(xué)家們相信,如果把人類(lèi)大量知識進(jìn)行邏輯化關(guān)聯(lián)和語(yǔ)義網(wǎng)絡(luò )存儲,最終人類(lèi)就能打造出全知全能,啥都懂的人工智能??上Ш镁安婚L(cháng),最終AI沒(méi)等來(lái)呢,PC先來(lái)了,專(zhuān)家系統紛紛被棄置,但是海量知識構成的知識庫卻流傳了下來(lái)。
2002年,基于語(yǔ)義Web技術(shù)和Freebase等優(yōu)質(zhì)知識庫,谷歌宣布推出了知識圖譜(Knowledge Graph)概念,并在2013年投入使用。所謂知識圖譜,實(shí)際上是建立在網(wǎng)頁(yè)百科知識庫基礎上,利用語(yǔ)義網(wǎng)絡(luò )進(jìn)行知識關(guān)聯(lián)的技術(shù)。它可以用來(lái)幫助學(xué)術(shù)人員快速搜集和理解信息,也可以用來(lái)分析情報,辨別信息真偽。在產(chǎn)業(yè)端則為搜索、內容推薦和智能問(wèn)答提供了基礎,成為今天AI領(lǐng)域不是十分熱門(mén),卻也足夠強勢的一個(gè)技術(shù)類(lèi)別。
如果說(shuō)了這么多還沒(méi)明白,那就舉個(gè)直白的例子吧:
假如,你這幾天很好奇一個(gè)叫PG ONE的詞為啥火了,然后你去搜索一下,結果給你推薦的詞是PG TWO、PG THREE......那你就跟沒(méi)搜一樣。假如蹦出來(lái)兩個(gè)詞,一個(gè)是賈乃亮,一個(gè)是地溝油,那么你就了然了嘛。
所謂的知識圖譜,就是讓智能體去理解知識之間網(wǎng)絡(luò )關(guān)系,并能主動(dòng)以此提供服務(wù)的技術(shù)。
今天的知識圖譜可專(zhuān)治各種“撒幣”
上文說(shuō)了知識圖譜專(zhuān)治各種“撒幣”行為,并不是隨便講講的。我們要知道,2002年知識圖譜技術(shù)如果跟王思聰們剛一波正面,那是基本沒(méi)有勝算的。
這里有幾種可能:首先是假如你的知識庫是更新到前年的,人家問(wèn)你PG ONE的嫂子是誰(shuí)你怎么辦?或者人家不問(wèn)你長(cháng)城有多長(cháng),問(wèn)你最長(cháng)的墻有多長(cháng)你怎么辦?
在考驗真人的直播答題過(guò)程中,可能面臨各種語(yǔ)言上的調整、提問(wèn)方式的改變,以及加入最新信息。這都是幾年前基于單一結構知識庫的知識圖譜技術(shù)難以勝任的。
這就把知識圖譜難住了嗎?不能夠,畢竟為答題而生,必須要搞點(diǎn)新高度出來(lái)才行。
這項技術(shù)在近幾年間發(fā)生了重要變化,比如:
1. 大數據+機器學(xué)習帶來(lái)了史無(wú)前例的效率契機
今天的AI復興,是建立在機器學(xué)習驅動(dòng)大數據的基礎上的,知識圖譜也是如此。舉例來(lái)說(shuō),搜索引擎知識圖譜技術(shù),是建立在搜索數據和百科、問(wèn)答等數據庫之上的。數據本身的優(yōu)質(zhì)化是知識圖譜運行的基礎。而在機器學(xué)習、深度學(xué)習領(lǐng)域的積累,則讓圖譜技術(shù)實(shí)現了及時(shí)化、逐步完善圖譜關(guān)聯(lián)強度和理解力提升。換句話(huà)說(shuō),知識圖譜技術(shù)正在變得愈發(fā)即時(shí)性與可成長(cháng)。
2. 語(yǔ)音交互成為啟動(dòng)知識圖譜的新形式
讓知識圖譜想要真的為人類(lèi)所用,那么就不能是人類(lèi)用固定方式去觸發(fā)知識圖譜的模板。而應該是知識圖譜主動(dòng)理解人類(lèi)的語(yǔ)言和思維習慣,做到主動(dòng)輸出服務(wù)。這就需要知識圖譜與語(yǔ)音交互緊密結合。
3. 強語(yǔ)義理解能力成為關(guān)鍵
能聽(tīng)懂“長(cháng)城有多長(cháng)”,卻聽(tīng)不懂“長(cháng)城從東到西一共有多少距離”的知識圖譜,顯然是知識沒(méi)譜。深度學(xué)習各種語(yǔ)意、語(yǔ)義、語(yǔ)序和方言的知識圖譜能力,也成為了目前知識圖譜技術(shù)的喚醒核心。
這幾種能力加持下,把知識圖譜偽裝成選手去搞“撒幣”,顯然已經(jīng)不算什么了......但是如果只干這點(diǎn)事,其實(shí)也蠻虧的。
“撒”出一個(gè)明天
無(wú)論是語(yǔ)音交互還是機器視覺(jué),我們今天正在努力教會(huì )AI一件事,那就是識別??墒?,在識別之后呢?AI下一步要干什么?識別的下一步當然是理解和處理,但如果想讓AI開(kāi)啟這些能力,很多人都認為,知識圖譜的爆發(fā)將是AI下一步的必經(jīng)之路。
知識圖譜的核心,在于通過(guò)數據生成可視化的知識鏈條,用鏈條形成網(wǎng)絡(luò ),利用網(wǎng)絡(luò )來(lái)進(jìn)行預測、生成自動(dòng)化,最終生成機器主動(dòng)提供的智能化服務(wù)。
要知道,人類(lèi)理解世界并不是基于一個(gè)個(gè)散亂的信息,而是基于信息背后的“知識”。
我們期待的知識圖譜技術(shù),是通過(guò)這種技術(shù)的完善,把AI調整到主動(dòng)輸出服務(wù)模式。傳統計算時(shí)代是你想到的,電腦幫你做出來(lái)。而知識圖譜時(shí)代,是你想不到的,AI可以想到。
能做到這一步的AI技術(shù),當然不會(huì )只滿(mǎn)足去答題,做個(gè)直播。人家的使命是改變世界好不好?
其實(shí),知識圖譜作為一種隱藏的后端技術(shù),今天已經(jīng)悄然布局在我們生活的方方面面。比如我們今天在百度搜“李白寫(xiě)過(guò)哪些飲酒詩(shī)?”,已經(jīng)不是跳出來(lái)有這些關(guān)鍵詞的網(wǎng)站,而是直接跳出來(lái)你想要的答案,這背后就是知識圖譜解答了你的問(wèn)題。
更重要的是,知識圖譜技術(shù)作為AI交互手段的必要觸達點(diǎn),正在為其他AI產(chǎn)業(yè)提供幫助,比如智能處理、無(wú)人駕駛。更遠的未來(lái),或許是利用知識圖譜技術(shù)達成物聯(lián)網(wǎng)間的協(xié)作、人機交互的全新升級,能做的遠遠不止于答題這一件小事。
所以呢,直播平臺上誰(shuí)給誰(shuí)撒幣,誰(shuí)是大撒幣,其實(shí)也不是很重要了。真正重要的是,技術(shù)正在努力把未來(lái)的幣,撒到現在的土壤里。
評論
全部評論(166)
-
最新最熱
行業(yè)資訊 -
訂閱欄目
效率閱讀 -
音頻新聞
通勤最?lèi)?ài)