久久一区二区精品,亚洲综合久久久久久中文字幕,国产综合精品一区二区,日韩欧美久久一区二区,综合欧美国产视频二区,亚洲国产欧美日韩精品一区二区三区,亚洲一区二区综合

人類(lèi)想聽(tīng)懂動(dòng)物的語(yǔ)言,AI能幫上忙么?
智能相對論 2018-01-24 09:47:33

近日,有一個(gè)視頻在養寵圈中廣泛流傳,引無(wú)數養寵人士潸然淚下。視頻的主角是動(dòng)物行為專(zhuān)家Heidi Wright和一只生命即將走到盡頭的導盲犬,Heidi Wright以她的能力為媒介,將導盲犬的肢體動(dòng)作和聲音翻譯成人語(yǔ),幫助它和主人進(jìn)行最后的交流。在Heidi Wright的轉述中,導盲犬表示了無(wú)法繼續守護主人的惋惜,還不停地呼叫另一只狗伙伴,讓它照顧好主人。

這段視頻在引發(fā)人們感動(dòng)的同時(shí),也讓許多人感到遺憾,很多家庭都養有寵物,這些寵物陪伴了主人十數年,早已成為了特殊的家庭成員??墒墙^大部分人都無(wú)法像上文提及的主人那般幸運,能夠傾聽(tīng)到狗狗的心聲,在這名“親人”辭世時(shí)也只能抱憾相送。

無(wú)數人曾設想過(guò),是否有可能出現一種翻譯工具,讓寵物的語(yǔ)言能夠被人類(lèi)聽(tīng)懂、理解呢?

人寵語(yǔ)言互譯并非偽命題

美國資深動(dòng)物行為專(zhuān)家康·斯洛波奇科夫(Con Slobodchikoff)教授稱(chēng),未來(lái)五至十年內,人類(lèi)使用一種手機大小的裝置——寵物語(yǔ)言翻譯器,便能與動(dòng)物進(jìn)行“對話(huà)”。這位北亞利桑那大學(xué)的生物教授花了30年研究草原土撥鼠的行為,他用AI軟件記錄并分析草原土撥鼠的叫聲,將其翻譯成英語(yǔ)。他還發(fā)現這些草原上的小家伙們“具有語(yǔ)言所有方面的復雜通信系統”。而目前,他正試圖籌集資金來(lái)開(kāi)發(fā)貓和狗的語(yǔ)音翻譯設備。

在這條未知明暗的道路上探索的顯然不止他一人。天下熙熙皆為利來(lái),天下攘攘皆為利往,其實(shí)“寵物語(yǔ)言翻譯器”的低配版早就被放上了電商平臺,并取得了可觀(guān)的銷(xiāo)量,賣(mài)家聲稱(chēng)這個(gè)設備經(jīng)實(shí)測翻譯準確率高達80%??v覽評論,“好玩”“有意思”“靈氣”之類(lèi)的好評不在少數,從中我們也可以窺知消費者對于寵物語(yǔ)言翻譯器的需求與肯定。

4S營(yíng)銷(xiāo)理論下,僅做到趣味性的滿(mǎn)足顯然不夠,寵物語(yǔ)言翻譯這塊才剛剛開(kāi)掘的沃土已吸引了無(wú)數“賞金獵人”的眼光。如果按斯洛波奇科夫教授所說(shuō)的,這項技術(shù)能在十年內成為現實(shí),小范圍滿(mǎn)足的是人與寵物的交流溝通,大范圍可能是人類(lèi)一統動(dòng)物世界的溫和策略與夢(mèng)想。

自動(dòng)語(yǔ)音識別技術(shù)和語(yǔ)音翻譯技術(shù)助力

低配版寵物語(yǔ)言翻譯器運用的技術(shù)原理就是對狗狗的叫聲、動(dòng)作等生物信號進(jìn)行采樣,對獲取的數據進(jìn)行頻譜分析,對姿勢動(dòng)作DSP運算數字化處理,把得到的翻譯語(yǔ)言以中文形式語(yǔ)音播報出來(lái)。但是由于采樣的范圍和機器內存等的局限性,這種低配寵物語(yǔ)言翻譯器在翻譯的準確度和豐富性方面尚有待提高。相較之下,為實(shí)現人狗溝通而設計的No More Woof耳機要更勝一籌。

過(guò)去幾年,AI領(lǐng)域的進(jìn)步帶來(lái)了自動(dòng)語(yǔ)音識別技術(shù)和語(yǔ)音翻譯技術(shù)的顯著(zhù)改進(jìn),計算機算法已經(jīng)可以通過(guò)對大量數據進(jìn)行的學(xué)習和訓練來(lái)解釋語(yǔ)言,而不是通過(guò)一組死板規則進(jìn)行預編程。

No More Woof是由北歐發(fā)明與發(fā)現協(xié)會(huì )( NCID )開(kāi)發(fā)的,應用的是三個(gè)不同技術(shù)領(lǐng)域的最新技術(shù)的組合,即腦電圖( EEG )傳感、微計算和專(zhuān)用腦-機接口(BCI)軟件,主要由腦電圖耳機、Raspberry Pi 處理器和一款便攜音箱組成。這些傳感器是腦電圖記錄器,可以降低讀數,減少離子電流在狗腦中的電壓波動(dòng)。然后由微型計算機拾取波動(dòng),在這種情況下形成一個(gè)覆盆子pi,并對它們作出解釋。

例如,大腦中有一種特定的電信號來(lái)定義疲勞感,還有一些最容易被發(fā)現的神經(jīng)模式:“我餓了”“我累了”“我很好奇那是誰(shuí)?”“我想尿尿”……耳機中的傳感器會(huì )捕捉這種特殊的電信號,并將它們轉化為人們能夠聽(tīng)懂的語(yǔ)言。

再結合基礎的自動(dòng)語(yǔ)音識別技術(shù)和語(yǔ)音翻譯技術(shù),計算機算法可以大致地分辨出寵物的情緒。這是短時(shí)間內寵物語(yǔ)言翻譯能達到的制高點(diǎn),至于要通過(guò)寵物語(yǔ)言翻譯器來(lái)了解動(dòng)物伙伴們真正的內心世界,還期待人類(lèi)進(jìn)一步的研究。

精確翻譯之路仍山高水遠,中間的代溝需要填平

需要指出的是,動(dòng)物的大腦并不如人類(lèi)的大腦復雜,人腦的活動(dòng)通常有一個(gè)明確的目標導向,動(dòng)物的大腦卻不一定。人的各種語(yǔ)言之間的轉換也具有相對窄范圍的對應關(guān)系,而動(dòng)物的語(yǔ)言與人類(lèi)的語(yǔ)言則對應范圍很寬,比如,狗會(huì )發(fā)出急促的叫聲,可能是因為想要向主人乞食,也可能是因為警惕陌生人,還可能是對主人不陪自己玩的責怪。如果它想表達的是這一種,而AI翻譯器卻傳達為另一種,那么就容易將人和寵物之間的溝通引入“歧途”,從而完全喪失了寵語(yǔ)翻譯的意義了。

那么有沒(méi)有可能通過(guò)AI實(shí)現完全精準的寵物語(yǔ)言翻譯呢?任重而道遠。通過(guò)自動(dòng)語(yǔ)音識別技術(shù)和語(yǔ)音翻譯技術(shù),計算機算法可以大致地分辨出寵物的情緒,但要明確更深層次的寵物肢體動(dòng)作和叫聲的內在意圖,AI還需要一場(chǎng)“扭轉乾坤”的大革命。

在這方面,我們可以聯(lián)想AI在同聲傳譯上的表現,之前很多媒體搞起了“AI會(huì )取代哪些工作崗位”的預測,筆譯、口譯在許多預測中被認為被取代率高居榜首,這并非空穴來(lái)風(fēng)。AI翻譯是當今AI領(lǐng)域的一個(gè)熱點(diǎn),搜狗、谷歌、Facebook、網(wǎng)易等都削尖了腦袋想要分一杯羹,卯足了勁兒想要成為這一領(lǐng)域的領(lǐng)頭羊,畢竟人工翻譯領(lǐng)域人工成本高居不下。如果能用AI解決高成本問(wèn)題,無(wú)疑劫走其中大部分的紅利。

然而,就目前來(lái)看,AI翻譯并沒(méi)有完全取代人工翻譯。相比于對其他事物的了解,人更了解人自身,而針對人自身語(yǔ)言所進(jìn)行的AI翻譯尚且前路未朗,AI又如何在寵物語(yǔ)言翻譯領(lǐng)域嶄露頭角呢?在智能相對論(微信ID:aixdlun)看來(lái),AI在寵物語(yǔ)言翻譯方面的應用,還需要填平這些“代溝”:

1. 數據關(guān),成風(fēng)盡堊之技無(wú)的放矢。要明確動(dòng)物語(yǔ)言所表達的具體意義,需要先對動(dòng)物的叫聲和即時(shí)腦電波動(dòng)進(jìn)行完整的采樣比對,再在這些數據的基礎上建立數據庫。而這兩種數據都存在著(zhù)廣泛性和多樣性,以犬類(lèi)為例,不同的犬種聲帶粗細寬窄各不相同。針對同一情景發(fā)出的叫聲分貝高低和尖細情況也不同,而刺激犬類(lèi)發(fā)出叫聲的場(chǎng)景又是難以窮盡的,單單收集犬類(lèi)的聲音樣本就是一個(gè)無(wú)比巨大的工程了,數據庫自然也難以完善。

2. 技術(shù)關(guān),空手搏斗難制勝。一個(gè)AI翻譯產(chǎn)品做到翻譯精確至少需要攻破幾個(gè)難題:形式端,拍譯要攻克圖像識別,同聲翻譯要攻克語(yǔ)音識別;內容端,攻克文本語(yǔ)言分析、大數據。而AI還沒(méi)有發(fā)展到能夠極為精確地處理這些問(wèn)題的階段,機器缺乏對視覺(jué)場(chǎng)景、聽(tīng)覺(jué)場(chǎng)景、自然語(yǔ)言處理的常識判斷。

如搜狗搜索在2017年6月的分享會(huì )上發(fā)布了創(chuàng )新產(chǎn)品搜狗翻譯APP,應用了基于生物學(xué)習的神經(jīng)網(wǎng)絡(luò )機器翻譯(NMT)系統,將翻譯精確度提升到一個(gè)前所未有的高水準,然而在翻譯效果的“信達雅”上,仍然只做到了“信” 的層面,對語(yǔ)言背后的幽默、情感等豐富含義的解讀離人們所期待的水準還有些距離。

3.語(yǔ)義關(guān),語(yǔ)料積累、場(chǎng)景收集和副語(yǔ)言與文化背景成痛癢之地。AI翻譯在文本或語(yǔ)言的寓意分析方面還強差人意。與人類(lèi)語(yǔ)言相比,動(dòng)物語(yǔ)言都是即時(shí)信號,信息內容全部關(guān)于當下,或示威,或示警,或示愛(ài)……從中看不到用語(yǔ)言來(lái)激起對過(guò)去的聯(lián)想的跡象,并且單個(gè)個(gè)體能發(fā)出的聲音形式太單一了,蘊含在其中的豐富信息難以明確表達。

寵物語(yǔ)言翻譯的難點(diǎn)不僅在于聲音的收集,更在于聲音背后具體含義的對應。這種對應是寬范圍的,難以精確的,機器缺乏對視覺(jué)場(chǎng)景、聽(tīng)覺(jué)場(chǎng)景、自然語(yǔ)言處理的常識判斷,無(wú)法精確理解語(yǔ)音所表達的內涵,甚至在這個(gè)方面還比不上人類(lèi)對動(dòng)物語(yǔ)言的理解。人可以根據生活經(jīng)驗來(lái)理解動(dòng)物語(yǔ)言,比如看到狗狗沖著(zhù)陌生人吠叫,人們可以推測它是在防備這個(gè)陌生人,而機器可能就沒(méi)辦法很好地理解這個(gè)畫(huà)面,從而做出錯誤的判斷。

又比如,“好”這個(gè)字是日常交際的常用字,在百度漢語(yǔ)顯示有19種語(yǔ)義,這些語(yǔ)義是結合具體場(chǎng)景來(lái)體現的,當偶遇熟人時(shí),“好”的意思是問(wèn)好;當別人征求意見(jiàn)時(shí),“好”用來(lái)表示同意;當人們商討時(shí),又可以用“好”來(lái)表示反問(wèn)……可見(jiàn)場(chǎng)景對于語(yǔ)義具有至關(guān)重要的影響,機器的正確理解場(chǎng)景的這件事上還需要加油,從而提高語(yǔ)義翻譯上的高精確性。

4. “歷史包袱”難抖掉,AI難以跟上生命體的學(xué)習進(jìn)程。狗的叫聲在一定歷史時(shí)期并不是一成不變的,狗憑借自身的靈性以及主人的后天馴養,具備有學(xué)習能力,例如狗類(lèi)中智商排名第一的邊境牧羊犬智力水平已經(jīng)相當于6歲~8歲的小孩,經(jīng)過(guò)學(xué)習,在放牧時(shí)它會(huì )用不同的叫聲來(lái)驅使羊群,控制羊群走向。還有一些寵物狗,甚至會(huì )在人類(lèi)的刻意訓練下發(fā)出類(lèi)似“媽媽”的叫聲,寵物語(yǔ)言在日新月異的變化,計算機卻很難抖掉語(yǔ)言的“歷史包袱”,這些也造成了寵物語(yǔ)言翻譯的困境。

動(dòng)物語(yǔ)言和人語(yǔ)之間的代溝是客觀(guān)存在的,AI所能做的,只能是不斷改進(jìn)自身的功能,用科學(xué)手段完善數據庫、內容、語(yǔ)料和場(chǎng)景。形式和內容雙管齊下,才能將這條橫亙在動(dòng)物語(yǔ)言和人語(yǔ)之間的代溝填平,在堅實(shí)的地基上建立起實(shí)現人和動(dòng)物“有效溝通”的“巴別塔”。

4
歡迎關(guān)注商界網(wǎng)公眾號(微信號:shangjiexinmeiti)

評論

登錄后參與評論

全部評論(39)

廣告
廣告
廣告
商界APP
  • 最新最熱
    行業(yè)資訊

  • 訂閱欄目
    效率閱讀

  • 音頻新聞
    通勤最?lèi)?ài)

廣告