時代拓靈首推AI個性化語音交互, 邊緣計算賦能智能音箱

在大家享受智聯(lián)網(wǎng)帶來便捷的同時,不斷猜想未來的人機交互會發(fā)展成何種模式。語音無疑是最直接的邏輯交互方式。如何讓機器真正做到“知我所想,行其我意”變得尤為重要。作為最有可能打開這個市場第一個入口的智能音箱,多家巨頭都做了資金與技術投入?,F(xiàn)如今,國內(nèi)外已經(jīng)有多款智能音箱產(chǎn)品面世。作為國內(nèi)為數(shù)不多的具備完整業(yè)內(nèi)領先算法并產(chǎn)品落地的智能音頻公司,時代拓靈正式推出基于聲紋識別的遠場語音交互智能音箱方案。

聲紋投入應用

新穎且實用性極強的落地產(chǎn)品

時代拓靈語音交互技術提供基于聲紋識別的個性化解決方案,讓音箱變得真正智能。聲紋識別(Voiceprint Recognition)是什么?與指紋、虹膜等生物識別手段類似,聲紋識別是從一個人的語音片段中提取出獨特且有規(guī)律的特征數(shù)據(jù),下次再聽到這個聲音的時候能快速識別出來的技術。

聲紋識別用處頗多。首先,它保證智能音箱使用的安全性和私密性。假如我們在初次使用智能音箱時了對家中小孩子的聲音進行了錄入,那么系統(tǒng)會根據(jù)孩子的聲紋特征作為依據(jù),對孩子后續(xù)的使用做規(guī)劃和限制;在公共場合,當智能音箱詢問是否要讀新到的短信時,也可以通過聲紋識別避免他人的惡作劇。其次,有個人定制感。在家中多人使用同一個智能音箱的情況下,當人們想放歌、購物時,不同的聲紋可以通過該人的歷史記錄作個性化推薦。

至于聲紋識別在智能音箱上應用的品牌,國外已有Amazon的Echo和谷歌的Google Home等使用了該項技術,Echo現(xiàn)在甚至可識別最多十人的聲音。而國內(nèi)最早號稱做出了聲紋識別功能的則是阿里的天貓精靈。時代拓靈現(xiàn)在也已經(jīng)將該技術落地于產(chǎn)品上,其成熟的算法使時代拓靈走在行業(yè)前列。

時代拓靈首推AI個性化語音交互, 邊緣計算賦能智能音箱

前端處理

麥克風陣列技術

時代拓靈在智能音箱方案的前端使用了麥克風陣列,以取得更好的語音采集效果。我們甚至可以這么說,不把智能音箱的前端采集處理做好,下一步的識別以及更后的指令處理、執(zhí)行等等完全無從談起。

麥克風陣列由一定數(shù)目的麥克風,是用來對聲場的空間特性進行采樣并處理的系統(tǒng)。而我們在語音交互中,尤其是智能音箱方案涉及到非常多的遠場語音交互,麥克風陣列可以更好地解決更遠的距離、更復雜的場景中出現(xiàn)的識別問題。時代拓靈的麥克風陣列算法支持常見的雙麥,四麥,六麥方案,同時也成功的為合作伙伴提供了定制的高達16和24麥的大陣列方案。

相比單麥克風而言,麥克風陣列在時域和頻域的基礎上增加了空域的概念,確定聲源在空間中的位置,從而達到聲源定位的目的。

另一方面,我們知道要使音箱執(zhí)行正確的指令,首先應該獲取純凈而正確的語音信號。在復雜的環(huán)境中,從含有噪音的語音信號中將目標語音提取出來,也是智能音箱技術中重要的一環(huán),這個過程我們稱之為語音增強。麥克風陣列在此層面,通過波束形成技術,細致地處理了單麥很難應對的非平穩(wěn)噪聲和混響的影響,也在提取聲源的同時更好地抑制噪聲。時代拓靈的語音增強技術已經(jīng)在多個場景下使用,比如阿里巴巴釘釘?shù)钠髽I(yè)通訊產(chǎn)品。

時代拓靈首推AI個性化語音交互, 邊緣計算賦能智能音箱

云場語音交互

邊緣計算大顯身手

時代拓靈首推AI個性化語音交互, 邊緣計算賦能智能音箱

時代拓靈語音交互方案采用邊緣計算,將運算集中在低功耗端上設備處理,分擔云平臺的工作量,結合信號處理和深度學習,聚焦聲學的采集端。

邊緣計算不但是近期熱門話題之一,投入使用之快也令人瞠目結舌。谷歌云平臺(GCP)于近期發(fā)布了全新的邊緣計算服務Cloud IoT Core,VMware也推出的用于建立、管理和擴展IoT基礎設施的Pulse IoT Center平臺。除去這些科技巨頭對于邊緣計算的研發(fā),美國最新一代的列車也在使用邊緣計算+IoT云平臺搭配的解決方案,其設備24小時不間斷監(jiān)測火車的運動數(shù)據(jù),減少碰撞風險的同時也提高列車的安全性,將重要數(shù)據(jù)回傳云端。

時代拓靈首推AI個性化語音交互, 邊緣計算賦能智能音箱

智能音箱作為智能家居、IoT重要流量入口,必須依靠先進的邊緣計算才能達到快速響應,更高效的數(shù)據(jù)收集和分析,以及最佳用戶體驗。時代拓靈語音交互核心算法全部于端上根據(jù)環(huán)境自適應計算,減少了網(wǎng)絡交互的時間,在存儲和計算復雜度雙層優(yōu)化深度學習神經(jīng)網(wǎng)絡,達到低功耗高性能的喚醒、聲紋識別,降噪,立體聲回聲消除效果。時代拓靈的智能音箱方案目前已適配了多家主流嵌入式平臺,包括高通、MTK、全志、瑞芯微、TI等,與合作伙伴如創(chuàng)維,酷曼等打造的落地產(chǎn)品近期會陸續(xù)上市

時代拓靈首推AI個性化語音交互, 邊緣計算賦能智能音箱

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2018-05-25
時代拓靈首推AI個性化語音交互, 邊緣計算賦能智能音箱
在大家享受智聯(lián)網(wǎng)帶來便捷的同時,不斷猜想未來的人機交互會發(fā)展成何種模式。語音無疑是最直接的邏輯交互方式。

長按掃碼 閱讀全文