極客網(wǎng)·人工智能1月12日 訓練文本到語音模型通常需要更多或更長的樣本,但微軟開發(fā)的VALL-E可以從三秒鐘的音頻剪輯中克隆出任何人的聲音。網(wǎng)絡安全專家表示,如果沒有適當?shù)南拗拼胧?,它可能被用于網(wǎng)絡釣魚攻擊或傳播錯誤信息。
除了減少生成新聲音的訓練時間之外,VALL-E通過保留原始樣本的語調(diào)、魅力和風格,創(chuàng)造出比其他模型更自然的合成聲音。在編寫文本轉(zhuǎn)語音腳本時,可以根據(jù)需要對這些參數(shù)進行調(diào)整。
擁有這些功能意味著,只要從某人的電話、會談甚至播客中錄下三秒鐘的聲音,該模型就可以將其聲音合成為任何語音,例如可能會讓政客、演員甚至家庭成員說出轉(zhuǎn)帳或付款的話語。
微軟表示,與之前的合成語音模型相比,VALL-E的性能有所提高,以至于人們很難分辨聲音的真假。
就像用于訓練DALL-E2和GPT-3的大型生成式人工智能模型一樣,開發(fā)人員向人工智能系統(tǒng)中輸入了大量的音頻材料進行訓練。在訓練模型時,他們使用了長達6萬小時的演講錄音,其中大部分來自使用視頻會議Teams應用程序錄制的錄音。
VALL-E的使用場景
微軟目前還沒有對外開放VALL-E的代碼,只是發(fā)布了使用該工具生成的示例音頻文件。目前還不清楚微軟何時或是否計劃將VALL-E作為公共訪問或商業(yè)工具提供。
人工智能開發(fā)商Tovie.AI首席執(zhí)行官Joshua Kaiser表示,該模型的設計方式允許用戶采用更少的數(shù)據(jù)做更多的事情,這對于那些試圖創(chuàng)建語音合成的開發(fā)商來說至關重要,因為這些公司沒有足夠的數(shù)據(jù)來提高性能。他說:“我們認為,這將使許多行業(yè)受益,例如零售業(yè)、金融科技業(yè)以及游戲行業(yè),這些行業(yè)已經(jīng)開始采用語音界面,使整個過程更容易訪問?!?/p>
Gartner副總裁兼分析師Arun Chandrasekaran表示,VALL-E最大的好處在于其潛在的規(guī)模。它可以在“零樣本”或“少樣本”場景中有效,在這些場景中,很少有特定領域的訓練數(shù)據(jù)可用。他說:“此外,如果這些模型可以作為云計算服務交付,與傳統(tǒng)方法相比,它們可以減少建立和運行模型所需的時間和精力?!?nbsp;
Chandrasekaran解釋稱,這項技術(shù)在現(xiàn)實世界中有幾個用例,包括語音編輯(可以糾正某個單詞或句子),不同場景下的語音背景化,交互式虛擬學習,以及客戶服務自動化。
VALL-E的使用確實存在風險,包括欺騙語音識別或模仿特定的演講者和名人,這可能會導致錯誤信息的快速傳播。這可能是微軟遲遲不發(fā)布該技術(shù)背后的代碼或發(fā)布API的原因,就像OpenAI和其他公司對GPT-3和DALL-E2等文本和圖像生成工具所做的那樣。這將使采用真實聲音進行網(wǎng)絡釣魚攻擊,或通過YouTube視頻或播客在網(wǎng)上傳播假新聞變得更容易。
VALL-E的欺詐風險
網(wǎng)絡欺詐可能包括允許網(wǎng)絡犯罪者訪問使用聲紋作為密碼的銀行或安全系統(tǒng),盡管其中許多系統(tǒng)都有檢測實時聲音還是錄音聲音的機制。它也可以用于網(wǎng)絡釣魚騙局,從電話中提取簡短的語音樣本,然后使用該樣本創(chuàng)建一個新的語音模型,可以更容易地說服某人透露密碼,也可能欺騙一些公司的財務經(jīng)理。
互聯(lián)網(wǎng)安全解決方案供應商Check Point Software安全工程師Muhammad Yahya Patel表示,VALL-E等技術(shù)的進步不應該令人擔憂,但仍應謹慎對待此類系統(tǒng)。他說,“盡管VALL-E有其顯著的優(yōu)點,但隨著它越來越成熟并融入我們的日常生活,微軟新的VALL-E文本到語音模型可能會對網(wǎng)絡安全產(chǎn)生一些令人擔憂的影響。如果說我們從去年吸取了什么教訓的話,那就是網(wǎng)絡犯罪分子會利用任何途徑誘騙毫無戒心的受害者,讓他們透露重要的密碼或財務信息。詐騙電話是威脅行為者常用的一種方法,考慮到這些活動的成功率,這種擔憂是有充分理由的。”
他表示,這項新技術(shù)可能會給網(wǎng)絡犯罪分子提供升級技術(shù)的機會,并引入個人元素,包括允許他們模仿受害者熟悉的人員的聲音。“這將使任何人都很難區(qū)分他們信任的人的請求和網(wǎng)絡罪犯分子的請求。同樣,隨著我們走向銀行現(xiàn)在都在使用語音認證來授權(quán)交易的時代,很容易看到網(wǎng)絡犯罪分子以個人為目標獲得帳戶的訪問權(quán)限。關鍵是要理解黑客利用新技術(shù)的機會,并因此采取必要的預防措施。”
行業(yè)媒體已經(jīng)聯(lián)系微軟就其如何減輕VALL-E的潛在濫用發(fā)表評論,但未予置評。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )