語音識別技術(shù)擁有足夠高的評價,,但一直以來缺乏足夠的表現(xiàn)。由于無法精確的識別人類語音的表達(dá),,使人們在使用語音識別技術(shù)的時候總會遇上各種各樣的錯誤,,結(jié)果就是人們無法通過語音直接打電話和寫短信。不過,,這一切都有可能改變,,關(guān)鍵詞又是蘋果(Apple)。
蘋果去年 4 月收購一家名為 Siri 的公司,,該公司之前推出了一個應(yīng)用,,能夠識別人們的語音,針對人們提出的問題進(jìn)行回答,。Siri 所使用的語音識別技術(shù)由在該領(lǐng)域浸淫已久的 Nuance 所開發(fā)的,。此后,蘋果與 Nuance 一直保持接觸,,并取得了專利授權(quán),,現(xiàn)在大家都知道了,蘋果將在 iOS 5 整合名為 Dragon 的語音識別技術(shù),。因此,,iOS 5 也許會內(nèi)建語音識別接口(API)供開發(fā)者調(diào)用。
而這,,有可能讓蘋果開啟下一扇人機(jī)交互的大門,。
語音識別技術(shù)已經(jīng)足夠成熟
Dragon 語音識別引擎是相當(dāng)?shù)某墒欤?iOS 平臺上使用該引擎的 Dragon Dictionary 以極高的識別精確度,,效果讓人驚異,。而 Android 平臺上由 Nuance 推出的 FlexT9,即使售價為 5 美元都收到 1100 份評論,,以及平均 4 顆星的評價??梢娬Z音識別技術(shù)已經(jīng)邁向成熟,,能耐得住市場的考驗。
Google 也注意到語音識別技術(shù)的潛力,。之前 Google 從 Nuance 中挖來了一位創(chuàng)始人,,在 Nuance 工作十年之久的專家,。如今用于 Android 上的語音識別技術(shù)被 Slate 評價為“確實(shí)可用”。即使拐著彎問的問題也難不倒它,,比如說一英里等于多少埃(計量單位 1 埃 = 1.0 × 10 -10 米)這樣,。
在手機(jī)越變越大,觸控屏越來越流行的情況下,,語音識別技術(shù)讓人能夠用一只手來操作手機(jī),,提供了方便。至少,,有短信來的時候不必痛苦的按虛擬鍵盤,,只需要動動嘴巴就行了。
蘋果知道如何讓用戶接受新的操控方式
盡管語音識別技術(shù)已經(jīng)足夠成熟,,但未必就能讓如今的手機(jī)更加易用,。因為新的操作方式等于改變用戶過往的習(xí)慣,這等于用戶過往的經(jīng)驗全不管用,。假如手機(jī)提供了語音識別功能,,但用戶都不去用的話,這項技術(shù)即使再革新也沒有意義,。
因此 Nuance 引導(dǎo) FlexT9 的用戶到一系列的視頻教程去,,讓用戶明白如何操作。作為反例,,Slate 指出 Android 的語音識別技術(shù)不夠人性,,用戶需要念出“逗號”、“句號”才能輸入標(biāo)點(diǎn)符號,。
而蘋果能夠讓消費(fèi)者輕易地接受新的科技:第一個 iPhone 廣告其實(shí)是一個教程,,消費(fèi)者從廣告中就學(xué)會如何利用 iPhone 上網(wǎng)、收發(fā)郵件以及搜索附近的商店,。最終,,消費(fèi)者接受了觸摸操控,也成就了 iPhone 的輝煌,。
如今,,語音識別技術(shù)也是一種新的操控方式,而蘋果是去做推廣的廠商,。至少蘋果不會只通過枯燥的視頻教程來讓用戶學(xué)會如何用語音來操控手機(jī),。
蘋果是用戶體驗大師
一個產(chǎn)品有成熟的技術(shù),和成功的推廣,,也未必能夠留住用戶的心,。
在 iPhone 之前已經(jīng)有很多款使用觸控屏的手機(jī)出現(xiàn)了,但是蘋果的長處就是讓科技變得簡單易用,,貼合人性,。這使 iPhone 完成了手機(jī)的設(shè)計上的革命?,F(xiàn)在人們已經(jīng)忘卻了實(shí)體鍵盤,忘卻了軌跡球,,取而代之的是一整塊觸控屏,。
通過深度整合語音識別技術(shù),相信蘋果還能讓變革再一次發(fā)生,,至少可以讓人們對著手機(jī)說幾句話就能發(fā)一條短信或瀏覽網(wǎng)頁,。而對于開發(fā)者來說,語音識別技術(shù)無疑開啟另一扇大門,,讓他們的應(yīng)用設(shè)計更具有想象力,。
我們?nèi)匀粺o法得知蘋果和 Nuance 合作的具體內(nèi)容,但我們有理由相信蘋果能夠成功的把語音識別技術(shù)帶入移動領(lǐng)域,。