被互聯(lián)網(wǎng)女皇看好的語音,將成為巨頭爭奪的焦點(diǎn)

KPCB合伙人、享有“互聯(lián)網(wǎng)女皇”稱號的瑪麗·米克爾的互聯(lián)網(wǎng)趨勢報(bào)告于今天正式發(fā)布。毫不夸張地說,這份報(bào)告是互聯(lián)網(wǎng)行業(yè)分析的“超級碗”,它用200多頁的Keynote濃縮了全球龐大而復(fù)雜的互聯(lián)網(wǎng)發(fā)展現(xiàn)狀和趨勢,是互聯(lián)網(wǎng)從業(yè)者、投資人以及想要窺見互聯(lián)網(wǎng)風(fēng)貌的外界人士不可多得的參考資料。

有人說,今年報(bào)告亮點(diǎn)不多,在我看來,亮點(diǎn)卻非常之多:不僅覆蓋了手機(jī)、電商、社交、廣告等基本面,還點(diǎn)名了移動(dòng)營銷、網(wǎng)絡(luò)直播、智能汽車諸多正在崛起的所有新興領(lǐng)域。與IDC等機(jī)構(gòu)報(bào)告不同的是,女皇報(bào)告更側(cè)重于行業(yè)現(xiàn)象概括和行業(yè)趨勢展望,事實(shí)證明,她對未來趨勢的評判準(zhǔn)確率相當(dāng)之高。而今年報(bào)告最大亮點(diǎn)在于:語音。213頁的Keynote,23頁給了語音,篇幅遠(yuǎn)遠(yuǎn)超過汽車、直播等領(lǐng)域,僅次于每年的重頭戲即“營銷”的31篇。

女皇認(rèn)為麥克風(fēng)正在取代鍵盤

瑪麗·米克爾認(rèn)為,語音正在被重塑,成為人機(jī)交互的新范式,在過去75年里,每10年就有一次人機(jī)交互的重大革新,人類對機(jī)器的操作,從物理手柄按鍵,到物理鍵盤鼠標(biāo),再到觸摸屏,而現(xiàn)在語音成為了重要的交互方式。

在其看來,語音交互相對于傳統(tǒng)交互而言具有以下特點(diǎn):輸入更快速,人類每分鐘可說出150個(gè)單詞,打字卻只能完成40個(gè)單詞;使用更簡單,不需要用手和眼,時(shí)間更及時(shí),不需要任何學(xué)習(xí);更加個(gè)性化,機(jī)器可基于上下文、環(huán)境、位置、語調(diào)等大環(huán)境更好地理解人類的需求。從技術(shù)角度來看,語音計(jì)算具有成本低、尺寸小的特點(diǎn),特別適合物聯(lián)網(wǎng)。

為何語音現(xiàn)在會(huì)爆發(fā)?瑪麗·米克爾認(rèn)為:

1、技術(shù)成熟是核心原因之一。如果語音識(shí)別準(zhǔn)確率從95%提升到99%將從量變引發(fā)質(zhì)變,即“爆發(fā)點(diǎn)”到來,語音識(shí)別準(zhǔn)確率已從2010年的70%上升到今年的90%,百度、谷歌、Hound等平臺(tái)的語音識(shí)別準(zhǔn)確率已超過90%,針對戶外嘈雜環(huán)境和講話者特性的語音識(shí)別是下階段的攻克重點(diǎn)。

2、語音交互應(yīng)用正在日益變多。語音搜索正在蠶食搜索份額,百度、谷歌的語音搜索在近十年來均取得了數(shù)十倍的增長,其中安卓、百度和必應(yīng)語音搜索比例分別達(dá)到20%、10%、25%;以Siri為代表的語音助手正在快速普及,美國用戶使用這類工具的比例,已從2013年的30%增加到2015年的65%。因?yàn)檎Z音能夠解放雙手和眼睛,人們越來越多地在車?yán)?、家里和隨身使用語音。相關(guān)數(shù)據(jù)顯示,從2014年到2016年間,全球API調(diào)用百度語音識(shí)別以及文本轉(zhuǎn)語音(TTS)的每日使用量急速攀升,百度語音在百度產(chǎn)品中使用率快速增長。

3、語音吸引更多第三方開發(fā)者。開發(fā)者擁抱語音大幅增加了支持語音交互的軟件和硬件,女皇重點(diǎn)闡述了Amazon眼下炙手可熱的硬件:Echo。其內(nèi)置了Amazon Alexa語音助手,目標(biāo)是占領(lǐng)家居、汽車、手機(jī)的麥克風(fēng),還能智能購物。這款產(chǎn)品銷量已突破400萬臺(tái)。女皇更是大膽指出:語音拐點(diǎn)已經(jīng)到來,在2015年智能手機(jī)銷量下滑之后,Echo銷量或?qū)Ⅱv飛。

英雄所見略同。在瑪麗·米克爾預(yù)測語音會(huì)成為核心交互方式的同時(shí),科技巨頭早已在這一領(lǐng)域大力投入。2014年百度世界大會(huì)上李彥宏預(yù)測:五年內(nèi)語音和圖像搜索比例有可能突破50%。百度在人工智能上一項(xiàng)顯著的進(jìn)展便是基于深度學(xué)習(xí)的Deep Speech在噪音環(huán)境下的語音識(shí)別效果超越了谷歌,這一研究成果在瑪麗·米克爾的報(bào)告中被提及,該項(xiàng)技術(shù)已成功應(yīng)用到百度語音搜索上。目前,百度語音搜索已通過人工智能做到了“聽”和“說”,而且還嘗試完成人類復(fù)雜的行為——溝通。集成語音識(shí)別、語義理解、深度問答、知識(shí)推理、多輪對話、智能摘要、情感分析、語言生成、語音合成等能力于一身后,相較于鍵盤輸入,百度語音搜索已經(jīng)能夠滿足用戶的多種復(fù)雜需求,引領(lǐng)人機(jī)交互邁入聽說時(shí)代。

此外,不久之前的谷歌I/O大會(huì)上,最亮點(diǎn)產(chǎn)品是類似于Echo的Google Home,其內(nèi)置了Google Assitant語音助手。而在即將召開的蘋果開發(fā)者大會(huì)WWDC上,iOS 10最大亮點(diǎn)很可能會(huì)是Siri。語音是下一站,已成全球共識(shí),“麥克風(fēng)+觸摸屏”取代“鍵盤+鼠標(biāo)”,已是大勢所趨。

語音正在多個(gè)領(lǐng)域全面開花

“女皇報(bào)告”重點(diǎn)提到了語音的三大典型應(yīng)用:搜索、助理和Echo,一個(gè)重要事實(shí)是,語音不只是在這些領(lǐng)域發(fā)揮作用,在許多領(lǐng)域,它都比鍵盤越來越有存在感。

1、語音搜索:移動(dòng)搜索的重要分支

谷歌、百度、Bing,全球主流搜索引擎的語音搜索比例都在逐步增加,麥克風(fēng)圖標(biāo)變得跟搜索框一樣重要。搜索引擎來自移動(dòng)端的搜索流量均已超過50%,人們在自帶麥克風(fēng)的移動(dòng)設(shè)備上使用語音更方便,而在移動(dòng)場景下打字并不方便。有報(bào)告指出,百度語音搜索的整體用戶量在2015年增長超過3倍,用戶中的90后和00后的人群占比接近50%,百度語音搜索已經(jīng)成為眾多年輕人移動(dòng)互聯(lián)網(wǎng)生活的標(biāo)配,優(yōu)勢在于省去了中英文輸入法切換的繁瑣、支持口語化多輪交互、能夠提供貼心的語音播報(bào)和有聲搜索。

2、語音助手:不再是被調(diào)戲的玩具

幾年前,Siri這是一個(gè)被調(diào)戲的玩具?,F(xiàn)在,它可以理解很多命令,比如設(shè)置鬧鐘、添加日歷,打開App等,語音助理已完成從玩具到工具的蛻變。除了Siri之外,Windows內(nèi)置的Cortana、Google Now升級而來的Google Assitant,以及百度、搜狗、科大訊飛等公司均推出了自己的語音助理軟件。以百度推出的度秘為例,已經(jīng)接入到手機(jī)百度APP,用戶可在手百端直接調(diào)用,使用語音對話的形式享受點(diǎn)餐、購物、路線、訂票等多項(xiàng)生活類服務(wù)??梢娨龊谜Z音助理并不容易,除了語音識(shí)別和語義理解之外,它必須要能“完成任務(wù)”,而這需要獲取其他設(shè)備和應(yīng)用的控制權(quán),而這一點(diǎn)只有巨頭才能做到,創(chuàng)業(yè)型玩家基本已經(jīng)消失。

3、語音通訊:不再是昂貴的溝通

微信能夠成為超級App,一大重要原因在于它支持語音通信,類似于對講機(jī)的語音交互,給了人們在傳統(tǒng)手機(jī)通訊下前所未有的體驗(yàn)。需要流量,但相對于傳統(tǒng)電話而言已很廉價(jià)。事實(shí)上,傳統(tǒng)電話也已被互聯(lián)網(wǎng)化,有信等網(wǎng)絡(luò)電話App的崛起表明,人們未來只需要為語音通訊花很少的錢。女皇說,語音是最有效率的交互方式。除此之外,語音還是最自然、最簡單和最有效的溝通方式,免費(fèi)的語音通訊將會(huì)成為大勢所趨,運(yùn)營商正在被逼著依靠販賣流量謀生。

4、語音內(nèi)容:不再是冷門的形式

微博剛剛興起時(shí),許朝軍做了一個(gè)啪啪,要做語音版的微博,后來發(fā)生的事情大家都知道了。不過,語音內(nèi)容正在卷土重來。最近在行做的“分答”十分火爆,這款A(yù)pp集合了語音、打賞、共享經(jīng)濟(jì)諸多新興模式,讓知識(shí)分享前所未有的有趣。而在去年,喜馬拉雅等網(wǎng)絡(luò)電臺(tái)崛起了。這些現(xiàn)象均表明,“聲音”依然會(huì)是十分重要的一類內(nèi)容形態(tài),人們不會(huì)浪費(fèi)耳朵這個(gè)重要器官,在許多場景下,“語音消費(fèi)”都更適合,比如開車時(shí),高德地圖與林志玲等明星合作的語音導(dǎo)航就取得很好的市場反饋。在許多垂直領(lǐng)域,例如教育,語音技術(shù)同樣在體現(xiàn)其重要性,比如通過語音技術(shù)做口語訓(xùn)練。就是說,不只是“麥克風(fēng)”變得重要了,“喇叭”也在變得重要。

5、語音硬件:隨時(shí)待命的助理

“女皇報(bào)告”說,Amazon Echo將要起飛。除了Echo之外,Google 已推出Google Home硬件,擁有Siri的Apple很可能會(huì)發(fā)布類似產(chǎn)品。為何“語音助理硬件”會(huì)普及?為什么不直接用手機(jī)上的Siri等助理呢?因?yàn)槭謾C(jī)是個(gè)人設(shè)備,并不適合家庭成員共享;而當(dāng)前的語音技術(shù),讓手機(jī)支持“隨時(shí)待命可被喚醒”會(huì)很耗電,基于Echo等家用設(shè)備不需擔(dān)憂這個(gè)問題。正是因?yàn)榇?,類似于Echo的產(chǎn)品將成為接下來的爆點(diǎn),國內(nèi)巨頭同樣在布局,京東已推出叮咚智能音箱,阿里巴巴聯(lián)合科大訊飛推出了“飛兒”,語音技術(shù)成熟的百度近日推出的度秘實(shí)體機(jī)器人也成功入駐肯德基,通過多輪交互和語音語義理解等技術(shù)為用戶完成智能點(diǎn)餐的過程。除了專用的語音助理硬件,語音與電視、與汽車等硬件的整合也會(huì)加速,國內(nèi)的“Echo”大戰(zhàn)即將爆發(fā)。

正如女皇報(bào)告所指出的那樣,語音即將成為最重要的交互方式之一,語音技術(shù)從量變到質(zhì)變的引爆點(diǎn)已經(jīng)到來。除了交互之外,語音還將在搜索、內(nèi)容、通訊和硬件等領(lǐng)域全面開花,“麥克風(fēng)”變得重要,“喇叭”亦將變得重要,關(guān)于聲音的戰(zhàn)爭已經(jīng)拉開序幕。

微博@互聯(lián)網(wǎng)阿超 微信 羅超(luochaotmt)

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2016-06-02
被互聯(lián)網(wǎng)女皇看好的語音,將成為巨頭爭奪的焦點(diǎn)
KPCB合伙人、享有“互聯(lián)網(wǎng)女皇”稱號的瑪麗·米克爾的互聯(lián)網(wǎng)趨勢報(bào)告于今天正式發(fā)布。毫不夸張地說,這份報(bào)告是互聯(lián)網(wǎng)行業(yè)分析的“超級碗”

長按掃碼 閱讀全文