微軟中國(guó)研究院說(shuō)談必應(yīng)辭典的幕后事

2010/11/14 19:14:55    編輯:軟媒 - 笨笨     字體:【

Win7之家afsion.com.cn):微軟中國(guó)研究院說(shuō)談必應(yīng)辭典的幕后事

文章來(lái)源:新京報(bào)

  近期的“微軟創(chuàng)新日”活動(dòng)展示了微軟研究院以及它和高校合作完成的各種科技發(fā)明,顯示出蓬勃的創(chuàng)造力。很多產(chǎn)品都不是拍拍腦袋就可以做出來(lái)的,它們之中既包含有聰明的創(chuàng)意,簡(jiǎn)單的技術(shù)應(yīng)用,也包含有艱深的數(shù)學(xué)運(yùn)用和豐富的人文內(nèi)涵。微軟研究院是如何組織實(shí)現(xiàn)這些技術(shù)發(fā)明的?帶著這個(gè)問(wèn)題,記者采訪了微軟亞洲研究院院長(zhǎng)洪小文博士。他向記者講述了“必應(yīng)詞典”的研發(fā)過(guò)程。

  1 成果 網(wǎng)絡(luò)詞典會(huì)“說(shuō)話”

  當(dāng)你進(jìn)入“必應(yīng)”的網(wǎng)址后,你會(huì)發(fā)現(xiàn)在輸入欄上方的選擇欄的右邊有一項(xiàng)是“詞典”。點(diǎn)開之后,在輸入欄中輸入一個(gè)英文單詞,不僅可以看到下面的英文解釋,更下面還有相應(yīng)的英中對(duì)照的例句。洪小文說(shuō),這些例句都是電腦自動(dòng)找出來(lái),機(jī)器翻譯的,有的加入了一定的人工修改。它們以“靠譜程度”為標(biāo)準(zhǔn)排列,最靠譜的句子排在最前面。在排列在前面的句子后面,通常會(huì)有一個(gè)小喇叭標(biāo)志和一個(gè)小電視標(biāo)志。點(diǎn)擊小喇叭標(biāo)志,會(huì)有一個(gè)男聲給你朗讀這個(gè)句子。洪小文說(shuō),這個(gè)聲音完全是機(jī)器讀出來(lái)的。記者感覺讀音和真人語(yǔ)音的相似程度相當(dāng)高。而點(diǎn)擊小電視標(biāo)志,會(huì)出現(xiàn)一段視頻,一個(gè)長(zhǎng)得相當(dāng)“萌”的小伙子會(huì)為你讀這句話,不但聲音很像真人,而且口型也分毫不差,但這段視頻也是機(jī)器合成的。

  2 開端 幫助寫作的“愿景”

  “必應(yīng)詞典”是一款功能豐富強(qiáng)大的軟件,并且通過(guò)汲取網(wǎng)絡(luò)資源而變得越來(lái)越強(qiáng)大。洪小文說(shuō),“必應(yīng)詞典”的前身是微軟亞洲研究院的“英庫(kù)”項(xiàng)目。那么,這個(gè)項(xiàng)目是如何開始的呢?

  洪小文說(shuō),微軟研究院(包括微軟亞洲研究院等6家研究院)提倡“以情境驅(qū)動(dòng)的研究”,人們先提出一個(gè)關(guān)于未來(lái)的“愿景”,然后通過(guò)自己或者多人合作研究來(lái)實(shí)現(xiàn)這個(gè)“愿景”。比如說(shuō)洪小文領(lǐng)導(dǎo)的“英庫(kù)”項(xiàng)目,開始的時(shí)候就是自動(dòng)機(jī)器翻譯、自然語(yǔ)言理解的學(xué)術(shù)研究。大概五六年前,洪小文和一些同事覺得這個(gè)技術(shù)越來(lái)越好了,于是把自己寫作時(shí)的情境加進(jìn)去,開始開發(fā)一個(gè)應(yīng)用軟件。

  記者對(duì)此非常感興趣的是:“情境”也好,“愿景”也好,都摻雜有復(fù)雜的情況和人類的感情,如何把它用科學(xué)的語(yǔ)言描述出來(lái),寫進(jìn)一個(gè)項(xiàng)目申請(qǐng)計(jì)劃書呢?洪小文的回答出乎記者的意料:根本沒有這樣的計(jì)劃書!

  洪小文說(shuō),微軟研究院的研究項(xiàng)目都沒有正式的計(jì)劃書,也不用申請(qǐng)經(jīng)費(fèi)。一般來(lái)說(shuō),幾個(gè)人在喝茶喝咖啡的時(shí)候提出一個(gè)想法,有興趣就可以做,領(lǐng)導(dǎo)只提供意見。微軟亞洲研究院的員工不吃“科研經(jīng)費(fèi)”,他們有固定工資,領(lǐng)導(dǎo)還會(huì)獎(jiǎng)勵(lì)他們的成果。

  3 過(guò)程 如何排除“雷人英語(yǔ)”

  英庫(kù)也是一樣,沒有正式的項(xiàng)目申請(qǐng)書,它開始得很自然,就是幾個(gè)人為了解決自己英文寫作時(shí)遇到的問(wèn)題。英文和中文互相轉(zhuǎn)換的問(wèn)題很多,這些問(wèn)題被分解,一一解決。比如說(shuō),英文每一個(gè)字都有一個(gè)空格,中文的字都是連著的,所以中譯英時(shí)如何“斷句”就是個(gè)大問(wèn)題。比如說(shuō)“一次性”被翻成了“one time sex”,這就是因?yàn)榘阉e(cuò)誤地?cái)喑闪?ldquo;一次”和“性”。借助“自然語(yǔ)言理解”的研究成果,可以比較好的完成這個(gè)“斷句”的工作。

  運(yùn)用微軟研究院一直在搞的數(shù)據(jù)挖掘技術(shù),“英庫(kù)”的研發(fā)者把網(wǎng)上所有有中英對(duì)照的句子收集起來(lái),通過(guò)分析這些句子,可以做一套模型。這樣,自動(dòng)機(jī)器翻譯、自然語(yǔ)言理解和數(shù)據(jù)挖掘等技術(shù)就天衣無(wú)縫地結(jié)合起來(lái)。

  4 升級(jí) 可愛小伙視頻現(xiàn)身

  那么,那個(gè)很“萌”的讀英文小伙又是怎么被加進(jìn)去的呢?洪小文說(shuō),開始的時(shí)候他們就想讓“英庫(kù)”用在寫作上,后來(lái)發(fā)現(xiàn)很多人用它發(fā)音學(xué)英文,所以負(fù)責(zé)語(yǔ)音的研究主管和負(fù)責(zé)自然語(yǔ)言的研究主管在咖啡間一碰面,就決定把“語(yǔ)音合成”的技術(shù)成果加進(jìn)去。機(jī)器把每個(gè)單詞都讀出來(lái)不難,難的是如何抑揚(yáng)頓挫把整句讀出來(lái)。通過(guò)研究院對(duì)自然語(yǔ)言的理解,“英庫(kù)”加進(jìn)了讀句子的功能。后來(lái)他們又說(shuō),能不能讓人也能夠看視頻學(xué)口型啊,于是又加入了電腦合成的視頻。

  在視頻中出現(xiàn)的小伙并不是演員,而是“英庫(kù)”的開發(fā)者之一,美國(guó)小伙馬特·斯考特(Matt Scott)。他在一個(gè)實(shí)驗(yàn)室里照一篇文章讀了30分鐘,研究人員把他的口型和聲音都錄下來(lái)了。通過(guò)實(shí)時(shí)的二維視頻合成技術(shù),技術(shù)人員可以讓斯考特的影像講任何話,方法就是把語(yǔ)音對(duì)應(yīng)的一個(gè)一個(gè)口型,加上中間的過(guò)渡口型實(shí)時(shí)調(diào)出來(lái),合成一段平滑的活動(dòng)影像。這樣,微軟研究院的電腦影像技術(shù)也派上了用場(chǎng)。正如洪小文所說(shuō),“以情境驅(qū)動(dòng)的研究是不同領(lǐng)域合作的最好催化劑”。

  新知專題采寫/本報(bào)記者 劉錚

  本專題感謝:洪小文(微軟亞洲研究院院長(zhǎng))

  ■ 目擊

  微軟曬出的新發(fā)明

  在近期舉辦的2010年度微軟創(chuàng)新日活動(dòng)中,記者看到了很多新鮮的發(fā)明。

  手機(jī)之類的移動(dòng)終端越來(lái)越多的連接到互聯(lián)網(wǎng),耗電就是一個(gè)大問(wèn)題,微軟印度研究院研發(fā)的“云計(jì)劃支持的節(jié)能高效移動(dòng)通信”就是為解決這個(gè)問(wèn)題開發(fā)的技術(shù)。現(xiàn)在,手機(jī)從互聯(lián)網(wǎng)上下載數(shù)據(jù)的時(shí)候,無(wú)論網(wǎng)絡(luò)是否通暢,都要耗費(fèi)一樣多的電能。“云計(jì)劃支持的節(jié)能高效移動(dòng)通信”會(huì)讓互聯(lián)網(wǎng)的數(shù)據(jù)先傳送到一個(gè)云計(jì)算中心,云計(jì)算中心一方面對(duì)傳輸?shù)臄?shù)據(jù)進(jìn)行壓縮優(yōu)化,另一方面會(huì)根據(jù)網(wǎng)絡(luò)的通暢程度來(lái)確定手機(jī)的用電量,以達(dá)到省電的目的。

  微軟雷蒙德研究院和

中國(guó)科學(xué)院國(guó)家天文臺(tái)合作的“萬(wàn)維天文望遠(yuǎn)鏡”項(xiàng)目是研究院和高校合作的典型例子。在這個(gè)軟件界面出現(xiàn)之前,美國(guó)航天局和世界各地的天文臺(tái)都創(chuàng)造和收集了大量的宇宙圖像,但這些數(shù)據(jù)分布在各處,彼此很難分享。“萬(wàn)維天文望遠(yuǎn)鏡”就是為了解決這個(gè)問(wèn)題而研制的。無(wú)論你放大軟件界面上的任何天空區(qū)域,都能調(diào)出關(guān)于這個(gè)區(qū)域的大量圖像,用戶會(huì)有一種“實(shí)時(shí)在宇宙中漫游”的感覺。

  除了“必應(yīng)詞典”,必應(yīng)還可能整合其他一些微軟研究院的研究成果,其中最有趣的是“基于輪廓的圖像搜索引擎”。比如說(shuō),在草圖板上畫一個(gè)圓,可以搜出月亮、太陽(yáng)、地球等圖像;而畫兩個(gè)圓,可以搜出兩個(gè)并排的壽司和自行車;如果在兩個(gè)輪之間簡(jiǎn)要地畫上一個(gè)三角形的梁,搜出來(lái)的圖像大多數(shù)都是自行車。

  最神奇有趣的發(fā)明還要數(shù)微軟和日本東京大學(xué)聯(lián)合研制的“電子輔助眼”。這其實(shí)是一種裝有電子傳感器的眼鏡,它可以和電腦相連,感知使用者的目光聚焦在何處。比如當(dāng)使用者看一只貓時(shí),系統(tǒng)就會(huì)知道他在看哪里,并且通過(guò)圖像識(shí)別軟件,系統(tǒng)可以分析出來(lái)他在看一只貓。未來(lái)通過(guò)這種電子輔助眼,雙手殘疾的人可以通過(guò)看字母表來(lái)打字,而普通人在逛超市的時(shí)候,看到哪個(gè)商品,系統(tǒng)就會(huì)顯示出這個(gè)商品的參數(shù),以及同類商品的價(jià)格。