久久一区二区精品,亚洲综合久久久久久中文字幕,国产综合精品一区二区,日韩欧美久久一区二区,综合欧美国产视频二区,亚洲国产欧美日韩精品一区二区三区,亚洲一区二区综合

李開(kāi)復:從1983到2017,我的幸運與遺憾
李開(kāi)復 2017-08-16 17:29:13

(1)

今天跟大家講個(gè)故事。

1983-1988年,我正在卡內基·梅隆大學(xué)讀計算機博士。

我正忙著(zhù)暑期教書(shū),秋天投身奧賽羅人機博弈(黑白棋游戲,那是機器第一次真正意義上打敗人類(lèi)冠軍的比賽)。

我的導師瑞迪教授(Raj Reddy,圖靈獎得主、卡內基梅隆大學(xué)計算機系終身教授、美國工程院院士)從美國國防部得到了300萬(wàn)美元的經(jīng)費,用來(lái)做不指定語(yǔ)者、大詞庫、連續性的語(yǔ)音識別。

也就是說(shuō),他希望機器能聽(tīng)懂任何人的聲音,而且可以懂上千個(gè)詞匯,懂人們自然連續說(shuō)出的每一句話(huà)。

這三個(gè)問(wèn)題都是當時(shí)無(wú)解的問(wèn)題。

而瑞迪教授大膽地拿下項目,希望同時(shí)解決這三個(gè)問(wèn)題。他在全美招聘了30多位教授、研究員、語(yǔ)音學(xué)家、學(xué)生、程序員,以啟動(dòng)這個(gè)有史以來(lái)最大的語(yǔ)音項目。

我也在這30人名單之內。

當時(shí)的科研背景是,業(yè)界已經(jīng)有類(lèi)似今天深度學(xué)習的算法,但一直沒(méi)有實(shí)現數據標準化,數據量也不足夠大。

美國幾大語(yǔ)音識別實(shí)驗室(如MIT、 CMU、 SRI、 IBM、貝爾實(shí)驗室)都是各用各的數據庫,測試數據不同,訓練數據不同,使用的語(yǔ)言模型不同,測試的詞匯量也不同。所以都各稱(chēng)業(yè)界第一,大家莫衷一是。

而每個(gè)大公司都有自己的商業(yè)需求,比如說(shuō)在語(yǔ)音識別方面,當年做打字機的IBM想做語(yǔ)音打字機,壟斷美國電信的AT&T要求貝爾實(shí)驗室識別電話(huà)號碼,所以大公司并沒(méi)有動(dòng)力來(lái)幫助小公司或學(xué)校。而小公司和學(xué)校,往往只有資源做些較小的數據集,結果通常也不如大公司的好。

不僅如此,數據不標準對AI研究而言是致命的,最后導致很多問(wèn)題,包括:

1、因為測試語(yǔ)料庫不同,最后識別結果,大家無(wú)法復制,也無(wú)法驗證。彼此不認可,而且因為數據沒(méi)有打通,算法就更不可能打通了。

2、因為每家做的領(lǐng)域不同,最后的結果都不可比。有些領(lǐng)域詞匯量小,比較容易,但是做出結果也可能不能通用。有些領(lǐng)域詞匯量大,但是約束很多,所以能說(shuō)的內容不多,導致比較容易識別,也不能通用。

3、因為每家訓練集不一樣大,而訓練集越大,一般結果越好。所以,有可能結果做的好,被認為并不是靠算法,而是靠數據量大。

4、對于學(xué)術(shù)單位來(lái)說(shuō),最大的問(wèn)題來(lái)自于沒(méi)有足夠的資源(也沒(méi)有興趣)收集、清洗、標注大量的語(yǔ)料。對于小公司來(lái)說(shuō),語(yǔ)料和計算力都是問(wèn)題。

最后,瑞迪教授計劃采用“專(zhuān)家系統”來(lái)完成項目,因為這個(gè)方法需要的數據有限。

專(zhuān)家系統是早期人工智能的一個(gè)重要分支,你可以把它看作是一類(lèi)具有專(zhuān)門(mén)知識和經(jīng)驗的計算機智能程序系統,一般采用人工智能中的知識表示和知識推理技術(shù)來(lái)模擬通常由領(lǐng)域專(zhuān)家才能解決的復雜問(wèn)題。

但我不認同。

(2)

之前參加過(guò)的奧賽羅的人機博弈,讓我對統計概念有了充分的理解,我對瑞迪教授的研究方法產(chǎn)生動(dòng)搖。

我相信建立大型的數據庫,然后對大的語(yǔ)音數據庫進(jìn)行分類(lèi),有可能解決專(zhuān)家系統不能解決的問(wèn)題。

另外,在1985年,美國標準局 (NationalInstitute of Standards and Technology)也意識到數據不標準會(huì )影響科研進(jìn)步。所以在語(yǔ)音識別問(wèn)題上,標準局設定了標準的語(yǔ)音和語(yǔ)言的訓練集、測試集。要求每個(gè)學(xué)校的每個(gè)團隊都用同樣的訓練集來(lái)訓練模型,可以自己調好系統參數,比賽最后一天大家拿到數據,有一天時(shí)間跑出結果,大家評比。

我從這個(gè)標準數據集和測試看到機會(huì )。

再三思考后,我決定鼓足勇氣,向瑞迪教授直接表達我的想法。我對瑞迪說(shuō):“我希望轉投統計學(xué),用統計學(xué)來(lái)解決這個(gè)‘不特定語(yǔ)者、大詞匯、連續性語(yǔ)音識別’。”

我以為瑞迪會(huì )有些失望,沒(méi)想到他一點(diǎn)都沒(méi)有生氣,他輕輕地問(wèn):“那統計方法如何解決這三大問(wèn)題呢?”

瑞迪教授耐心地聽(tīng)完我激情的回答后,用他那永遠溫和的聲音告訴我:“開(kāi)復,你對專(zhuān)家系統和統計的觀(guān)點(diǎn),我是不同意的,但是我可以支持你用統計的方法去做,因為我相信科學(xué)沒(méi)有絕對的對錯,我們都是平等的。而且,我更相信一個(gè)有激情的人是可能找到更好的解決方案的。”

那一刻,我的感動(dòng)無(wú)以倫比。因為對一個(gè)教授來(lái)說(shuō),學(xué)生要用自己的方法作出一個(gè)與他唱反調的研究。教授不但沒(méi)有動(dòng)怒,還給予充分的支持,這在很多地方是不可想象的。

統計學(xué)需要大數據庫,我們如何才能建立起大的數據庫呢?

瑞迪教授看到我愁眉不展的樣子,再一次給了我支持。他說(shuō),“開(kāi)復,雖然說(shuō)我還是對你的研究方法有所保留,但是,在科學(xué)的領(lǐng)域里,其實(shí)也無(wú)所謂老師和學(xué)生的區別,我們都是面臨這一個(gè)難題的攻克者,所以,如果你真的需要數據庫,那么,讓我去說(shuō)服政府幫你建立一個(gè)大的數據庫吧!”

瑞迪教授后來(lái)說(shuō)服了美國政府部門(mén)和美國標準局收集并提供了大量數據。我用美國標準局提供的標準大數據,跟多家拿國家錢(qián)的機構數據,后來(lái)一些不拿國家錢(qián)的單位(如:IBM,AT&T)也參與進(jìn)來(lái),我可使用的數據越滾越大。

除了大數據,統計學(xué)的方法還需要非??斓臋C器,瑞迪教授又幫我購買(mǎi)了最新的Sun 4機器。此后每次有新的機器,他都會(huì )說(shuō):“先問(wèn)問(wèn)開(kāi)復要不要。” 做論文的兩年多,我至少花了他幾十萬(wàn)美元的經(jīng)費。

瑞迪教授的寬容再次讓我感覺(jué)到一種偉大的力量,這是一種自由和信任的力量。

(3)

在導師的支持下,我開(kāi)始了瘋狂的科研工作。

當時(shí),我帶著(zhù)另一位學(xué)生一起用統計的方法做語(yǔ)音識別。同時(shí),其他30多人用專(zhuān)家系統做同樣的問(wèn)題。從方法上來(lái)說(shuō),我們在競爭,但是在瑞迪教授的領(lǐng)導下,我們分享一切,我們用同樣的樣本訓練和測試。

在1986年底,我的統計系統和他們的專(zhuān)家系統達到了大約一樣的水平,40%的辨認率。這雖然還是完全不能用的系統,但畢竟是學(xué)術(shù)界第一次嘗試這么難的問(wèn)題,大家還是比較欣喜和樂(lè )觀(guān)的。

1987年5月,我們大幅度地提升了訓練的數據庫,采用了新的建模方法,不但能夠用統計學(xué)的方法學(xué)習每一個(gè)音,而且可以用統計學(xué)的方法學(xué)習每?jì)蓚€(gè)音之間的轉折。針對有些音的樣本不夠,我又想出了一種方法(generalized triphones)來(lái)合并其他的音。這三項工作居然把機器的語(yǔ)音識別率從原來(lái)的40%提高到了80%!后來(lái)又提高到96%。

統計學(xué)的方法用于語(yǔ)音識別初步被驗證是正確的方向。

大家都相信了我用的機器學(xué)習方法和隱馬可夫模型算法,并且拋棄了不可行的專(zhuān)家系統(專(zhuān)家系統只達到60%的識別率)。在我的博士論文基礎上,后來(lái)的Nuance,微軟、蘋(píng)果等公司做出了業(yè)界最領(lǐng)先的產(chǎn)品。

1988年4月,我受邀到紐約參加一年一度的世界語(yǔ)音學(xué)術(shù)會(huì )議,發(fā)表學(xué)術(shù)論文。

這個(gè)成果撼動(dòng)了整個(gè)學(xué)術(shù)領(lǐng)域。這是當時(shí)計算機領(lǐng)域里最頂尖的科學(xué)成果。

語(yǔ)音識別率大幅度提高,讓全世界語(yǔ)音研究領(lǐng)域閃爍出一道希望的光芒,從此,所有以專(zhuān)家系統研究語(yǔ)音識別的人全部轉向了統計方法。

會(huì )后,《紐約時(shí)報》派記者JohnMarkoff來(lái)到匹茲堡對我作了采訪(fǎng),文章發(fā)表于1988年7月6日,占了科技版首頁(yè)的整個(gè)半版。在這篇文章里,馬可奧夫大力報道了我的論文的突破。當時(shí),我只覺(jué)得在和一個(gè)和藹可親的記者聊天,事后,我才知道這是一名才華橫溢的著(zhù)名記者,三次提名普利策獎,并在斯坦福兼教。

后來(lái),《商業(yè)周刊》把我的發(fā)明選為1988年最重要的科學(xué)發(fā)明。年僅26歲初出茅廬的我,第一次亮相就獲得這樣的成功,讓我感到很幸運,也讓我有了繼續向科技高峰攀爬的動(dòng)力。

而我也因此拿到了卡內基·梅隆大學(xué)的計算機博士學(xué)位,這離我1983年入學(xué)只有4年半的時(shí)間。在卡內基·梅隆大學(xué)的計算機學(xué)院,同學(xué)們平均6年以上才能拿到博士學(xué)位,我用這么短的時(shí)間拿到博士學(xué)位,是一項新的紀錄。

我也因此破格留校,成為一名26歲的助理教授。

(4)

遺憾的是,雖然我找到了方向和基本方法,但以當時(shí)的數據量級和計算水平,語(yǔ)音AI研究很難有商業(yè)化機會(huì )。我最終還是離開(kāi)科研界,進(jìn)入商界,用產(chǎn)品改變世界。

30年過(guò)了,AI發(fā)展的土壤終于肥沃起來(lái)。

伴隨互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)而來(lái)的大數據、高效的計算機運算能力等條件都齊備了??蒲腥藛T需要的數據集不再那么難以觸碰,只是需要有人牽頭讓更多的公司參與進(jìn)來(lái)。這在30多年前,我還是一個(gè)AI科研人員的時(shí)代,能接觸到真實(shí)世界里如此海量的數據,是個(gè)遙不可及的夢(mèng)想。

我當年受惠于瑞迪教授的幫助和指導,今天也非常希望能給更多和我一樣的年輕人,創(chuàng )造研究機會(huì )和條件。

所以,昨天創(chuàng )新工場(chǎng)、搜狗、今日頭條聯(lián)合發(fā)起“AI Challenger 全球AI挑戰賽”。三家公司分別投入大量資金、也拿出千萬(wàn)量級高質(zhì)量開(kāi)放數據集與寶貴GPU資源。

同時(shí),我也倡導商界和科研界能采用大量的數據和標準的測試方法,也歡迎更多的數據公司能夠參與到這個(gè)平臺里。

希望我們推出的Challenger.ai,可以幫助到中國AI人才成長(cháng)。

在我看來(lái),這次AIChallenger絕對不只是一個(gè)活動(dòng),也絕對不只是一個(gè)獎金200萬(wàn)、年底就結束的競賽,這是推進(jìn)中國AI人才成長(cháng)的重大催化劑。

希望3年或5年后,我們再來(lái)回顧這一段時(shí)光,我們發(fā)現中美AI人才之間沒(méi)有落差了,還能想到AI Challenger在這樣重大過(guò)程中扮演了一個(gè)小小角,我就感到這一切都有價(jià)值。

歡迎大家登錄大賽官網(wǎng)Challenger.ai,獲取信息并報名。關(guān)于這場(chǎng)大賽的具體信息可點(diǎn)擊文末的鏈接了解(要在電腦頁(yè)面上才能報名哦)。

你們可能無(wú)法想象,我有多么羨慕你們,生活在數據爆炸的時(shí)代,有人提供數據和獎金池,讓有才華的人一展拳腳。

~END~

1
歡迎關(guān)注商界網(wǎng)公眾號(微信號:shangjiexinmeiti)
標簽李開(kāi)復  

評論

登錄后參與評論

全部評論(3)

廣告
廣告
廣告
商界APP
  • 最新最熱
    行業(yè)資訊

  • 訂閱欄目
    效率閱讀

  • 音頻新聞
    通勤最?lèi)?ài)

廣告