時(shí)代拓靈首推AI個(gè)性化語(yǔ)音交互, 邊緣計(jì)算賦能智能音箱

在大家享受智聯(lián)網(wǎng)帶來便捷的同時(shí),不斷猜想未來的人機(jī)交互會(huì)發(fā)展成何種模式。語(yǔ)音無(wú)疑是最直接的邏輯交互方式。如何讓機(jī)器真正做到“知我所想,行其我意”變得尤為重要。作為最有可能打開這個(gè)市場(chǎng)第一個(gè)入口的智能音箱,多家巨頭都做了資金與技術(shù)投入?,F(xiàn)如今,國(guó)內(nèi)外已經(jīng)有多款智能音箱產(chǎn)品面世。作為國(guó)內(nèi)為數(shù)不多的具備完整業(yè)內(nèi)領(lǐng)先算法并產(chǎn)品落地的智能音頻公司,時(shí)代拓靈正式推出基于聲紋識(shí)別的遠(yuǎn)場(chǎng)語(yǔ)音交互智能音箱方案。

聲紋投入應(yīng)用

新穎且實(shí)用性極強(qiáng)的落地產(chǎn)品

時(shí)代拓靈語(yǔ)音交互技術(shù)提供基于聲紋識(shí)別的個(gè)性化解決方案,讓音箱變得真正智能。聲紋識(shí)別(Voiceprint Recognition)是什么?與指紋、虹膜等生物識(shí)別手段類似,聲紋識(shí)別是從一個(gè)人的語(yǔ)音片段中提取出獨(dú)特且有規(guī)律的特征數(shù)據(jù),下次再聽到這個(gè)聲音的時(shí)候能快速識(shí)別出來的技術(shù)。

聲紋識(shí)別用處頗多。首先,它保證智能音箱使用的安全性和私密性。假如我們?cè)诔醮问褂弥悄芤粝鋾r(shí)了對(duì)家中小孩子的聲音進(jìn)行了錄入,那么系統(tǒng)會(huì)根據(jù)孩子的聲紋特征作為依據(jù),對(duì)孩子后續(xù)的使用做規(guī)劃和限制;在公共場(chǎng)合,當(dāng)智能音箱詢問是否要讀新到的短信時(shí),也可以通過聲紋識(shí)別避免他人的惡作劇。其次,有個(gè)人定制感。在家中多人使用同一個(gè)智能音箱的情況下,當(dāng)人們想放歌、購(gòu)物時(shí),不同的聲紋可以通過該人的歷史記錄作個(gè)性化推薦。

至于聲紋識(shí)別在智能音箱上應(yīng)用的品牌,國(guó)外已有Amazon的Echo和谷歌的Google Home等使用了該項(xiàng)技術(shù),Echo現(xiàn)在甚至可識(shí)別最多十人的聲音。而國(guó)內(nèi)最早號(hào)稱做出了聲紋識(shí)別功能的則是阿里的天貓精靈。時(shí)代拓靈現(xiàn)在也已經(jīng)將該技術(shù)落地于產(chǎn)品上,其成熟的算法使時(shí)代拓靈走在行業(yè)前列。

時(shí)代拓靈首推AI個(gè)性化語(yǔ)音交互, 邊緣計(jì)算賦能智能音箱

前端處理

麥克風(fēng)陣列技術(shù)

時(shí)代拓靈在智能音箱方案的前端使用了麥克風(fēng)陣列,以取得更好的語(yǔ)音采集效果。我們甚至可以這么說,不把智能音箱的前端采集處理做好,下一步的識(shí)別以及更后的指令處理、執(zhí)行等等完全無(wú)從談起。

麥克風(fēng)陣列由一定數(shù)目的麥克風(fēng),是用來對(duì)聲場(chǎng)的空間特性進(jìn)行采樣并處理的系統(tǒng)。而我們?cè)谡Z(yǔ)音交互中,尤其是智能音箱方案涉及到非常多的遠(yuǎn)場(chǎng)語(yǔ)音交互,麥克風(fēng)陣列可以更好地解決更遠(yuǎn)的距離、更復(fù)雜的場(chǎng)景中出現(xiàn)的識(shí)別問題。時(shí)代拓靈的麥克風(fēng)陣列算法支持常見的雙麥,四麥,六麥方案,同時(shí)也成功的為合作伙伴提供了定制的高達(dá)16和24麥的大陣列方案。

相比單麥克風(fēng)而言,麥克風(fēng)陣列在時(shí)域和頻域的基礎(chǔ)上增加了空域的概念,確定聲源在空間中的位置,從而達(dá)到聲源定位的目的。

另一方面,我們知道要使音箱執(zhí)行正確的指令,首先應(yīng)該獲取純凈而正確的語(yǔ)音信號(hào)。在復(fù)雜的環(huán)境中,從含有噪音的語(yǔ)音信號(hào)中將目標(biāo)語(yǔ)音提取出來,也是智能音箱技術(shù)中重要的一環(huán),這個(gè)過程我們稱之為語(yǔ)音增強(qiáng)。麥克風(fēng)陣列在此層面,通過波束形成技術(shù),細(xì)致地處理了單麥很難應(yīng)對(duì)的非平穩(wěn)噪聲和混響的影響,也在提取聲源的同時(shí)更好地抑制噪聲。時(shí)代拓靈的語(yǔ)音增強(qiáng)技術(shù)已經(jīng)在多個(gè)場(chǎng)景下使用,比如阿里巴巴釘釘?shù)钠髽I(yè)通訊產(chǎn)品。

時(shí)代拓靈首推AI個(gè)性化語(yǔ)音交互, 邊緣計(jì)算賦能智能音箱

云場(chǎng)語(yǔ)音交互

邊緣計(jì)算大顯身手

時(shí)代拓靈首推AI個(gè)性化語(yǔ)音交互, 邊緣計(jì)算賦能智能音箱

時(shí)代拓靈語(yǔ)音交互方案采用邊緣計(jì)算,將運(yùn)算集中在低功耗端上設(shè)備處理,分擔(dān)云平臺(tái)的工作量,結(jié)合信號(hào)處理和深度學(xué)習(xí),聚焦聲學(xué)的采集端。

邊緣計(jì)算不但是近期熱門話題之一,投入使用之快也令人瞠目結(jié)舌。谷歌云平臺(tái)(GCP)于近期發(fā)布了全新的邊緣計(jì)算服務(wù)Cloud IoT Core,VMware也推出的用于建立、管理和擴(kuò)展IoT基礎(chǔ)設(shè)施的Pulse IoT Center平臺(tái)。除去這些科技巨頭對(duì)于邊緣計(jì)算的研發(fā),美國(guó)最新一代的列車也在使用邊緣計(jì)算+IoT云平臺(tái)搭配的解決方案,其設(shè)備24小時(shí)不間斷監(jiān)測(cè)火車的運(yùn)動(dòng)數(shù)據(jù),減少碰撞風(fēng)險(xiǎn)的同時(shí)也提高列車的安全性,將重要數(shù)據(jù)回傳云端。

時(shí)代拓靈首推AI個(gè)性化語(yǔ)音交互, 邊緣計(jì)算賦能智能音箱

智能音箱作為智能家居、IoT重要流量入口,必須依靠先進(jìn)的邊緣計(jì)算才能達(dá)到快速響應(yīng),更高效的數(shù)據(jù)收集和分析,以及最佳用戶體驗(yàn)。時(shí)代拓靈語(yǔ)音交互核心算法全部于端上根據(jù)環(huán)境自適應(yīng)計(jì)算,減少了網(wǎng)絡(luò)交互的時(shí)間,在存儲(chǔ)和計(jì)算復(fù)雜度雙層優(yōu)化深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),達(dá)到低功耗高性能的喚醒、聲紋識(shí)別,降噪,立體聲回聲消除效果。時(shí)代拓靈的智能音箱方案目前已適配了多家主流嵌入式平臺(tái),包括高通、MTK、全志、瑞芯微、TI等,與合作伙伴如創(chuàng)維,酷曼等打造的落地產(chǎn)品近期會(huì)陸續(xù)上市

時(shí)代拓靈首推AI個(gè)性化語(yǔ)音交互, 邊緣計(jì)算賦能智能音箱

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-05-25
時(shí)代拓靈首推AI個(gè)性化語(yǔ)音交互, 邊緣計(jì)算賦能智能音箱
在大家享受智聯(lián)網(wǎng)帶來便捷的同時(shí),不斷猜想未來的人機(jī)交互會(huì)發(fā)展成何種模式。語(yǔ)音無(wú)疑是最直接的邏輯交互方式。

長(zhǎng)按掃碼 閱讀全文