世界因你不同 第四章 博士生涯:語音識別
    「什麼是做博士的目的?」在我選定研究方向,正準備挽起袖管大幹一番的時候,我們的院長尼科·海博曼問了我這個問題。我想都沒想,脫口而出,「就是在某一個領域做出重要的成果。」「不對。」尼科·海博曼教授不假思索地否定了我。他告訴我,「讀博士,就是挑選一個狹窄並重要的領域作研究,畢業的時候交出一篇世界一流的畢業論文,成為這個領域裡世界首屈一指的專家。任何人提到這個領域的時候,都會想起你的名字。」

    海博曼教授的「做世界某一個領域的一流」的觀點,讓我十分震驚,我從未奢望在20多歲時走到某個領域的頂峰,但是這種「要做就要做到最好」的激勵,我始終銘記在內心深處。

    看到了我的興奮,海博曼教授問我:「你懂了嗎?」我說:「懂了,我從卡內基·梅隆大學將帶走的就是這份改變世界的、頂尖的博士論文。」他又說:「不對,你從學校帶走最有價值的不是這份論文,而是你分析和獨立思考的能力、研究和發現真理的經驗,還有科學家的胸懷。當你某一天不再研究這個領域的時候,你依然能在任何一個新的領域做到最好。」這番話引起了我深深地思索,也再一次印證了「沉澱下來的才是教育」這句話的意義。學習成績只是一種表象的結果,而學習能力才是伴隨一生的能力。

    1983年10月,我走進語音識別的世界。開始和瑞迪教授一起探討語音識別領域裡現有的成果以及如何突破的可能性,瑞迪說,「你來做一個不特定語者的語音識別系統吧。」當時這在世界上是一個無解之謎。

    所謂不特定語者的語音識別就是說讓電腦能夠聽懂每一個人說出的話,並且識別出來,最後希望達到的最理想狀態就是讓機器對人的語言有所反應,最終達到「人機對話」的理想程度。在我當時所處的年代,人們所做的語音識別系統研究,還只能識別一個人的聲音,也就是「特定語者」的研究。因此,瑞迪教授對我的期望就是讓我把這個研究成果擴展出來,形成突破,讓機器對更多的人的語言識別率提高。

    瑞迪告訴我,「我覺得專家系統是解決不特定語者問題最好的方法,這也是最火的新技術。希望你試試。去吧,小伙子,盡情做你的研究,我這裡有科學基金的研究經費,因此你不用擔心錢的問題。」在巨大的期望下,瑞迪把課題的接力棒交給了我。

    經過數月的鑽研,我把整個研究過程寫了篇論文發表出來,得到了正面的回饋。第一次,人們知道,在有限的領域和單一的語者身上,專家系統研究出來的機器語音識別率可以達到95%。這意味著,人和機器可以進行簡單的對話了。那段時間,瑞迪開心得不得了,並且更加堅信「專家系統」的方法是個正確的選擇。

    儘管面對一片好評,我卻顯得非常沉默。其實,這個時候我內心的擔憂早已開始慢慢滋長了。因為,在研究的過程中,我已經發現專家系統的前景非常不明朗,因為機器經過很長時間的訓練,只能聽懂特定20個訓練者的語音。而人與人說話的音節和語調千變萬化,只要換了另外100人的聲音重新檢驗原來的研究成果,其識別率立即下降到不能想像的地步,只有30%左右。而且,我們僅僅用了26個詞作為詞彙,一旦增加詞彙,整個系統就將崩潰。

    1984年暑假即將來臨,我正沉浸在自己課題的十字路口上,不知道何去何從。這個時候我遇到了我的一個師兄彼得·布朗(PeterBrown),他看到我愁眉不展,就把我叫到一間教室裡,在黑板上寫了幾個統計學公式。彼得·布朗對我說,「開復,我知道你在做語音識別,並且為之苦惱,但是你為什麼不嘗試一下統計學的方法呢,從統計中抽取數據我想應該能夠提高語音識別率,你覺得呢?」

    所謂統計學的方法,就是從龐大的數據庫中進行歸類,通過特徵的歸納使得數據通過「分類器」,得到結果的一種方法。對於是否能用大量數據庫對聲音進行統計,我心中充滿了好奇與問號。而用統計學方法來研究語音識別的想法,開始在心中慢慢地滋生。
本站首頁 | 玄幻小說 | 武俠小說 | 都市小說 | 言情小說 | 收藏本頁