亞馬遜推出新一代基礎(chǔ)模型Amazon Nova,明年中旬推多模態(tài)到多模態(tài)模型

12月4日消息,亞馬遜在2024 re:Invent全球大會上,宣布推出新一代基礎(chǔ)模型Amazon Nova,Amazon Nova模型將在Amazon Bedrock中提供。

Amazon Nova包含四款先進的模型:

1、Amazon Nova Micro是一款僅處理文本的模型,能夠以極低的延遲和成本提供響應(yīng);

2、Amazon Nova Lite是一款極具成本效益的多模態(tài)模型,能夠快速處理圖像、視頻和文本輸入;

3、Amazon Nova Pro是一款功能強大的多模態(tài)模型,可在準確性、速度和成本之間實現(xiàn)絕佳平衡,適合多種任務(wù);

4、Amazon Nova Premier是亞馬遜的頂級多模態(tài)模型,專為復(fù)雜推理任務(wù)而生,并可用于作為“教師模型”來蒸餾定制模型。

目前,Amazon Nova Micro、Amazon Nova Lite和Amazon Nova Pro已全部正式可用,Amazon Nova Premier預(yù)計將在2025年第一季度可用。

此外,亞馬遜還推出了兩個全新模型——用于生成高質(zhì)量圖像的Amazon Nova Canvas和用于生成高質(zhì)量視頻的Amazon Nova Reel。

Amazon Nova Canvas是一款先進的圖像生成模型,能夠根據(jù)輸入的文本或圖像生成專業(yè)級的視覺內(nèi)容。它提供了便捷的編輯功能,用戶可以通過文本輕松調(diào)整圖像,控制顏色方案和布局。該模型內(nèi)置的安全控制措施確保AI的安全和負責(zé)任使用,包括水印功能,能夠追溯每張圖像的來源;以及內(nèi)容審核功能,限制可能產(chǎn)生的有害內(nèi)容。根據(jù)第三方的對比評估,Amazon Nova Canvas在性能上優(yōu)于OpenAI的DALL-E 3和Stable Diffusion,并在關(guān)鍵的自動化指標上表現(xiàn)出色。

Amazon Nova Reel是一款先進的視頻生成模型,能夠幫助客戶輕松從文本和圖像創(chuàng)建高質(zhì)量視頻,適用于廣告、營銷和培訓(xùn)等內(nèi)容創(chuàng)作??蛻艨梢允褂米匀徽Z言提示控制視覺風(fēng)格和節(jié)奏,包括相機運動、旋轉(zhuǎn)和縮放。根據(jù)第三方的評估,Amazon Nova Reel在質(zhì)量和一致性上優(yōu)于同類模型,客戶更傾向于選擇由其生成的視頻,而非Runway的Gen-3 Alpha生成的視頻。與Amazon Nova Canvas一樣,Amazon Nova Reel也具備內(nèi)置的安全控制措施,包括水印和內(nèi)容審核。目前,Amazon Nova Reel支持生成六秒的視頻,未來幾個月將支持最長為兩分鐘的視頻生成。

Amazon Nova模型與主流大模型性能比較

亞馬遜對Amazon Nova模型進行了廣泛的行業(yè)基準測試。結(jié)果表明,Amazon Nova Micro、Amazon Nova Lite和Amazon Nova Pro在各自類別中與最佳模型相比均表現(xiàn)得相當有競爭力。

Amazon Nova Micro在所有11項適用基準測試中,其表現(xiàn)與Meta的LLaMa 3.1 8B相當或更優(yōu),而在所有12項適用基準測試中,其表現(xiàn)也與Google Gemini 1.5 Flash-8B持平或更優(yōu)。憑借每秒210個輸出token的行業(yè)領(lǐng)先速度,Amazon Nova Micro非常適合需要快速響應(yīng)的應(yīng)用場景。

Amazon Nova Lite在同類模型中同樣具備強勁競爭力。與OpenAI的GPT-4o mini相比,它在19項基準測試中有17項表現(xiàn)持平或更優(yōu),與Google的Gemini 1.5 Flash-8B相比,在21項基準測試中也有17項表現(xiàn)相當或更優(yōu),與Anthropic的Claude Haiku 3.5相比,則在12項基準測試中有10項表現(xiàn)相當或更優(yōu)。除了在文本基準測試中展現(xiàn)出色的準確性外,Amazon Nova Lite在視頻、圖表和文檔理解方面也表現(xiàn)突出,這一點通過VATEX、ChartQA和DocVQA等基準測試得到了證明。此外,Amazon Nova Lite在智能體工作流上也表現(xiàn)優(yōu)異,如在Berkeley Function Calling Leaderboard(伯克利函數(shù)調(diào)用排行榜)上的函數(shù)調(diào)用能力,以及在理解視覺元素以在瀏覽器和計算機屏幕上執(zhí)行操作的核心能力方面表現(xiàn)出色,這一點在VisualWebBench(網(wǎng)頁瀏覽器操作基準測試)和Mind2Web(通用多模態(tài)代理基準測試)得到證明。

Amazon Nova Pro在與OpenAI的GPT-4o的20項基準測試中,有17項表現(xiàn)相當或更優(yōu);在與Google的Gemini 1.5 Pro的21項基準測試中,有16項表現(xiàn)持平或更優(yōu);在與Anthropic的Claude Sonnet 3.5v2的20項基準測試中,有9項表現(xiàn)相當或更優(yōu)。除了在文本和視覺智能基準測試中的準確性外,Amazon Nova Pro在遵循指令和多模態(tài)智能體工作流方面也表現(xiàn)出色,相關(guān)測評包括綜合RAG(CRAG)、Berkeley Function Calling Leaderboard(伯克利函數(shù)調(diào)用排行榜)和Mind2Web。

多語言和多模態(tài)支持,具備長上下文處理能力

Amazon Nova Micro、Lite和Pro支持200多種語言。Amazon Nova Micro支持128K輸入token的上下文長度,而Amazon Nova Lite和Pro的上下文長度可達300K token,處理視頻時長可達30分鐘。到2025年初,Amazon將支持超過200萬輸入token的上下文長度。

快速且具有成本效益

Amazon Nova模型快速,具有成本效益,且設(shè)計上易于與客戶的系統(tǒng)和數(shù)據(jù)無縫集成。Amazon Nova Micro、Lite和Pro在各自智能類別中,成本比Amazon Bedrock中表現(xiàn)最佳的模型至少便宜75%,同時也是Amazon Bedrock中對應(yīng)類別速度最快的模型。

支持微調(diào)以提升準確性

這些模型還支持自定義微調(diào),允許客戶根據(jù)自身專有數(shù)據(jù)中的已標記示例來提升準確性。Amazon Nova模型能夠從客戶的數(shù)據(jù)(包括文本、圖像和視頻)中學(xué)習(xí)最重要的信息,隨后Amazon Bedrock會訓(xùn)練一個私有的微調(diào)模型,以提供定制化響應(yīng)。

蒸餾用于訓(xùn)練更小、更高效的模型

除了支持微調(diào)外,這些模型還支持蒸餾,可以將規(guī)模更大、實力更強的“教師模型”中的特定知識轉(zhuǎn)移到更小的模型上,從而實現(xiàn)更高的精確度、更快的響應(yīng)速度以及更低的運營成本。

基于數(shù)據(jù)響應(yīng)的檢索增強生成(RAG)

Amazon Nova模型與Amazon Bedrock知識庫緊密集成,專注于檢索增強生成(RAG)方法,使客戶能夠通過利用自身的數(shù)據(jù)確保生成內(nèi)容的高度準確性和相關(guān)性。

針對智能體應(yīng)用進行優(yōu)化

Amazon Nova模型經(jīng)過優(yōu)化,便于智能體應(yīng)用在執(zhí)行多步驟任務(wù)時通過多個API與企業(yè)的專有系統(tǒng)和數(shù)據(jù)進行交互。

下一步計劃:語音到語音和多模態(tài)到多模態(tài)模型

亞馬遜計劃在2025年第一季度推出Amazon Nova語音到語音模型。該模型旨在通過理解自然語言的流式語音輸入,解釋語言和非語言信號(如語調(diào)和節(jié)奏),提供流暢的類人交互,徹底改變對話式AI應(yīng)用,確保低延遲的雙向交流。

此外,Amazon還在開發(fā)一種新模型,能夠接受文本、圖像、音頻和視頻作為輸入,并以任意模態(tài)生成輸出。這款具備本地多模態(tài)到多模態(tài)——即“任意到任意”模態(tài)能力的Amazon Nova模型預(yù)計將在2025年中旬推出。該模型將簡化應(yīng)用開發(fā),使同一模型能夠執(zhí)行多種任務(wù),如內(nèi)容模態(tài)轉(zhuǎn)換、內(nèi)容編輯,以及驅(qū)動能夠理解和生成所有模態(tài)的AI代理。(果青)

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-12-04
亞馬遜推出新一代基礎(chǔ)模型Amazon Nova,明年中旬推多模態(tài)到多模態(tài)模型
12月4日消息,亞馬遜云科技在2024 re:Invent全球大會上,宣布推出新一代基礎(chǔ)模型Amazon Nova,Amazon Nova模型將在Amazon Bedrock中提供。

長按掃碼 閱讀全文