語音識別:微軟下一代自然用戶界面技術(shù)

2010/8/4 16:48:04    編輯:軟媒 - vivi     字體:【

Win7之家afsion.com.cn):語音識別:微軟下一代自然用戶界面技術(shù)

       在8月3 日召開的 SpeechTEK 會議上,微軟介紹了他們接下來在語音技術(shù)領(lǐng)域的產(chǎn)品 –雖說沒有未公開的產(chǎn)品 –微軟的語音產(chǎn)品也有涉及近年來格外熱鬧的云計算。

  微軟語音技術(shù)部門總經(jīng)理 Zig Serafin 向 SpeechTEK 出席者概述了微軟在語音技術(shù)領(lǐng)域的進(jìn)展,事實上微軟自 1993 年就已將語音技術(shù)作為自然用戶界面的一部分了。當(dāng)年,微軟研究院就成立了語音研究組。

  在 1999 年,微軟完成了它的首個語音相關(guān)收購 –語音工具包廠商 Entropic。07 年,微軟花 10 億美元買下了語音識別公司 TellMe。但直到一年多前,微軟才合并其旗下所有的語音產(chǎn)品和技術(shù)為微軟語音部門,他們的使命是“讓軟件與服務(wù)因語音界面而更自然、更易于使用”。

  微軟并沒有把語音技術(shù)視為獨(dú)立的產(chǎn)品,更多的,微軟是將其作為微軟自然用戶界面戰(zhàn)略的一部分,整合與其他產(chǎn)品或服務(wù)。在接下來一年里,微軟將主要向市場推出以下4 類整合了微軟各種語音技術(shù)的新產(chǎn)品:

  車內(nèi)娛樂系統(tǒng)–就如在 CES 10 上宣布的 Kia UVO系統(tǒng),首輛搭載 UVO 的車將在今夏發(fā)布。

  Windows Phone 7 設(shè)備–已深度整合 TellMe 語音識別技術(shù),具體可。

  Kinect for Xbox–已整合語音識別功能,允許用戶通過語音與 Xbox 360 交互,具體可。

  企業(yè)生產(chǎn)力產(chǎn)品–目前有超過 1 億 Exchange 用戶可以用上語音郵件、語音翻譯和其他基于語音技術(shù)的產(chǎn)品(Exchange Online 也將支持這些)。同時,微軟 TellMe 產(chǎn)品每年利用 TellMe 云計算后端平臺處理 25 億次通話。

  微軟語言部門首席語音科學(xué)家 Larry Heck 稱,長期來說,微軟正試圖解決的正是這個問題:“我們何時才能部署達(dá)到理解人類對話級別的系統(tǒng)?”他回答了三點解決該問題的驅(qū)動力:

  -- 數(shù)據(jù)及相關(guān)機(jī)器自學(xué)習(xí)機(jī)制

  -- 云計算平臺,如 Azure和 TellMe 網(wǎng)絡(luò)后端平臺

  -- 搜索

  Heck 繼續(xù)補(bǔ)充道:“自然用戶界面能幫助用戶實現(xiàn)任何地點訪問數(shù)據(jù)的可能,但目前的入口(比如搜索引擎)對改進(jìn)計算機(jī)或設(shè)備理解人類自然對話,并沒有太大的幫助。在搜索引擎中,用戶習(xí)慣于輸入獨(dú)立的關(guān)鍵詞,而不是自然陳述的語句,但顯然手機(jī)上的語音搜索更近似人類的對話。”