自從百度把人工智能當(dāng)做核心發(fā)展戰(zhàn)略之后,這方面的進(jìn)展也是神速。
3 月 13 日,百度宣布推出一款名為SwiftScribe的網(wǎng)頁(yè)版應(yīng)用,它能夠利用人工智能技術(shù)把語(yǔ)音文件進(jìn)行轉(zhuǎn)錄,感興趣的可以去試試看。
長(zhǎng)期以來(lái),人們?cè)谵D(zhuǎn)錄語(yǔ)音文件時(shí),常常需要通過(guò)手動(dòng)逐字錄入。但是SwiftScribe這款應(yīng)用通過(guò)集成百度自主研發(fā)的語(yǔ)音識(shí)別技術(shù)以及功能簡(jiǎn)單的編輯工具,可以幫助人們實(shí)現(xiàn)語(yǔ)音文件快速、便捷的轉(zhuǎn)錄,提高生產(chǎn)效率。
據(jù)百度介紹,SwiftScribe 依托的核心技術(shù)來(lái)自百度的新一代深度語(yǔ)音識(shí)別系統(tǒng)—— Deep Speech 2。通過(guò)利用長(zhǎng)達(dá)數(shù)千小時(shí)的標(biāo)注語(yǔ)音數(shù)據(jù)進(jìn)行“訓(xùn)練”,Deep Speech 2可以不斷“學(xué)習(xí)”從語(yǔ)音中識(shí)別特定的字或詞。
(圖片來(lái)自:Networked India)
此外,百度還通過(guò)直覺(jué)快捷鍵以及人機(jī)交互技術(shù)來(lái)解決語(yǔ)音錄入的不連貫問(wèn)題。
對(duì)于那些職業(yè)速錄師來(lái)說(shuō),SwiftScribe 能成為他們的生產(chǎn)力利器。對(duì)于一段時(shí)長(zhǎng)為一小時(shí)的語(yǔ)音文件來(lái)說(shuō),常規(guī)情況下需要 4-6 小時(shí)去進(jìn)行人工轉(zhuǎn)錄,并且每分鐘的轉(zhuǎn)錄成本約合 1 美元。如果使用 SwiftScribe 的話(huà),所用時(shí)間能縮短差不多 40%。
不過(guò),雖然人工智能可以提高生產(chǎn)力,短時(shí)間內(nèi)還沒(méi)辦法完全取代人類(lèi)。在 SwiftScribe 完成初步的語(yǔ)音轉(zhuǎn)錄后,還需要人工去檢查大小寫(xiě)、標(biāo)點(diǎn)符號(hào)、錯(cuò)別字等等。
據(jù)百度的項(xiàng)目經(jīng)理吳甜介紹,SwiftScribe 目前僅支持一小時(shí)以?xún)?nèi)的語(yǔ)音文件轉(zhuǎn)錄,但團(tuán)隊(duì)還在對(duì)應(yīng)用的功能進(jìn)行進(jìn)一步開(kāi)發(fā),以后可能會(huì)增加對(duì)視頻文件的語(yǔ)音識(shí)別、支持更多文件格式以及自動(dòng)添加標(biāo)點(diǎn)符號(hào)等功能。
從第一代的 Deep Speech 到第二代的 Deep Speech 2,百度已經(jīng)在深度語(yǔ)音識(shí)別技術(shù)上深耕多年。2016 年,百度推出了使用 Deep Speech 系統(tǒng)的 TalkType,為 Android 鍵盤(pán)添加語(yǔ)音錄入功能。同年,百度的深度語(yǔ)音識(shí)別系統(tǒng) Deep Speech 2 還入選了美國(guó)《麻省理工評(píng)論》的 2016 年十大突破技術(shù)。
(百度 TalkType,圖片來(lái)自:VentureBeat)
如今,包括亞馬遜、蘋(píng)果、Google 和微軟在內(nèi)的多家互聯(lián)網(wǎng)巨頭都在布局語(yǔ)音識(shí)別技術(shù)領(lǐng)域,國(guó)內(nèi)的科大訊飛、搜狗等企業(yè)也都在語(yǔ)音識(shí)別領(lǐng)域有所建樹(shù)。
百度首席科學(xué)家吳恩達(dá)曾表示:
我認(rèn)為語(yǔ)音識(shí)別技術(shù)已經(jīng)發(fā)展到了非??煽康某潭?,使用的時(shí)候甚至都不用去想它。最好的科技往往是看不見(jiàn)的,而語(yǔ)音識(shí)別正在變得更加可靠,我希望它能夠退居幕后。
- 英特爾第一季度營(yíng)收127億美元,同比持平
- 國(guó)內(nèi)首個(gè)!百度宣布點(diǎn)亮昆侖芯3萬(wàn)卡集群
- 第三屆百度“文心杯”創(chuàng)業(yè)大賽啟動(dòng) 最高獎(jiǎng)金達(dá)7000萬(wàn)元
- 百度發(fā)布全球首個(gè)電商交易MCP、搜索MCP,幫助開(kāi)發(fā)者全面擁抱MCP
- 百度發(fā)布百度搜索開(kāi)放平臺(tái)·AI開(kāi)放計(jì)劃,開(kāi)放接入各類(lèi)AI應(yīng)用,賦能應(yīng)用開(kāi)發(fā)者
- 百度發(fā)布多智能體協(xié)作應(yīng)用「心響」,一句話(huà)解決復(fù)雜任務(wù)
- 內(nèi)容操作系統(tǒng)“滄舟OS”發(fā)布!百度文庫(kù)AI月活用戶(hù)近1億
- 百度發(fā)布高說(shuō)服力數(shù)字人:劇本生成、多模驅(qū)動(dòng) 僅需錄制2分鐘!
- 百度發(fā)布文心大模型X1 Turbo,價(jià)格僅為DeepSeek的25%
- 價(jià)格最高降80%!百度發(fā)布文心大模型4.5 Turbo,百萬(wàn)token輸入價(jià)僅0.8元
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。