面對如火如荼的生成式AI大戰(zhàn),全球電商老大亞馬遜、云計(jì)算老大亞馬遜云科技又雙叒發(fā)力了。就在12月4日舉辦于美國拉斯維加斯、6萬人現(xiàn)場參會的2024亞馬遜云科技re:Invent全球大會上,亞馬遜CEO Andy Jassy親自出馬,發(fā)布了亞馬遜自研的新一代基礎(chǔ)模型Amazon Nova。
比星巴克的中杯/大杯/超大杯更進(jìn)一步,Amazon Nova一出手就是“四大杯”:
Amazon Nova Micro:僅限文本對話,主打一個低價(jià)格和低延遲;Amazon Nova Lite:低成本的多模態(tài)大模型,處理圖像、視頻和文本輸入的速度極快;Amazon Nova Pro:高性能的多模態(tài)大模型,精度、速度和成本最佳“配方”,可處理廣泛的任務(wù);Amazon Nova Premier:系列中最強(qiáng)多模態(tài)大模型,可處理復(fù)雜的推理任務(wù),也可用于蒸餾客戶定制化的模型。在現(xiàn)場,Andy還曬出了Amazon Nova在CRAG、BFCL、VisualWebBench和Mind2Web等各大權(quán)威AI榜單上的分?jǐn)?shù),雖然不能說是屠榜,不過確實(shí)在檢索增強(qiáng)生成(RAG)、函數(shù)調(diào)用和智能體應(yīng)用等關(guān)鍵指標(biāo)處于領(lǐng)先地位。
目前,Amazon Nova Micro、Amazon Nova Lite和Amazon Nova Pro已全部正式可用,Amazon Nova Premier預(yù)計(jì)將在2025年第一季度可用。
你以為這就夠了嗎?緊接著,Andy Jassy又發(fā)布了兩個全新模型:用于生成高質(zhì)量圖像的Amazon Nova Canvas和用于生成高質(zhì)量視頻的Amazon Nova Reel。
亞馬遜云科技還計(jì)劃在2025年第一季度推出“語音到語音”(Speech to Speech)Amazon Nova模型,預(yù)計(jì)在2025年中旬推出具備“任意到任意”(Any to Any)模態(tài)能力的Amazon Nova模型。
總之,別人家有的模型,我亞馬遜云科技也都有,用Andy Jassy的話來說就是,“萬物皆可生成”。
這是否意味著,接下來亞馬遜云科技將“鼓勵”用戶們都轉(zhuǎn)用Amazon Nova?當(dāng)然不是。在這次大會上,Andy Jassy還說了一句意味深長的話:“選擇決定一切!需要用模型的時(shí)候,最關(guān)鍵的是,有很多可選的自由!”
從2024亞馬遜云科技re:Invent全球大會上的表現(xiàn),老冀認(rèn)為:亞馬遜給用戶提供的最大價(jià)值,恰恰就是選擇的自由。而且,這種選擇的自由不僅僅只限于模型,也不只是AI架構(gòu)的中間層,而是涵蓋了基礎(chǔ)架構(gòu)層、中間層、應(yīng)用層的方方面面。
中間層:一百多個模型一站式服務(wù)
在發(fā)布Amazon Nova之后,亞馬遜云科技CEO Matt Garman表示,Amazon Nova將與AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI等多個大模型一起,全部放到Amazon Bedrock當(dāng)中,供用戶選擇使用。
實(shí)際上,亞馬遜云科技自己就是大模型的深度使用者,目前公司內(nèi)部使用的生成式AI應(yīng)用超過1000個。亞馬遜云科技深知,用戶要的是能夠解決自己針對性問題的大模型,而不是只有通用能力的、或者只能炫技的大模型。
在這次大會上我們看到,亞馬遜云科技成為首家向用戶提供Luma AI最先進(jìn)的Luma Ray 2模型(其著名視頻模型的第二代)的云服務(wù)提供商。用戶可以通過Amazon Bedrock使用Ray 2,依據(jù)文本和圖像高效生成電影級質(zhì)感的高質(zhì)量、逼真視頻。
亞馬遜云科技還成為首家提供poolside的malibu和point模型訪問權(quán)限的云服務(wù)提供商,這兩個模型在代碼生成、測試、文檔編制以及實(shí)時(shí)代碼補(bǔ)全方面表現(xiàn)出色,能夠幫助工程團(tuán)隊(duì)提高生產(chǎn)力,更快編寫出更優(yōu)質(zhì)的代碼,并加速產(chǎn)品開發(fā)周期。
Stability AI可謂如今最熱的文生圖大模型開發(fā)商之一。如今,Stability AI旗下最先進(jìn)的文本轉(zhuǎn)圖像模型Stable Diffusion 3.5 Large也即將進(jìn)駐Amazon Bedrock,為媒體、游戲、廣告以及零售領(lǐng)域的客戶創(chuàng)建概念藝術(shù)、視覺效果以及詳細(xì)的產(chǎn)品圖像。
有了如此多當(dāng)紅大模型的加入,亞馬遜云科技仍然覺得不夠——雖然Amazon Bedrock中的模型能夠支持眾多任務(wù),但是許多客戶仍希望將新興的專用模型融入到他們的應(yīng)用程序中,為其獨(dú)特的用例如分析財(cái)務(wù)文檔或生成新型蛋白質(zhì)等提供支持。
有鑒于此,在2024亞馬遜云科技re:Invent全球大會上,亞馬遜云科技繼續(xù)放出大招,推出Amazon Bedrock Marketplace,直接給用戶一個模型市場。
如今,用戶已經(jīng)能夠從100多個模型中進(jìn)行查找與選擇,這些模型可部署在亞馬遜云科技上,并能通過Amazon Bedrock中的統(tǒng)一體驗(yàn)進(jìn)行訪問。這100多個模型中,既有Mistral AI的Mistral NeMo Instruct 2407、Technology Innovation Institute的Falcon RW 1B以及NVIDIA NIM微服務(wù)等熱門模型,還有用于金融行業(yè)的Writer的Palmyra-Fin、用于翻譯的Upstage的Solar Pro、Camb.ai的文本轉(zhuǎn)音頻MARS6以及用于生物學(xué)的EvolutionaryScale的ESM3生成模型等眾多專業(yè)模型。無論你想要什么模型,直接到Amazon Bedrock Marketplace上面來找就對了。
實(shí)際上,一些用戶已經(jīng)享受到了這種一站式服務(wù)的好處。在這次大會上,Zendesk這家全球服務(wù)軟件公司,就在Amazon Bedrock中訪問用于翻譯的Widn.AI等專用模型,通過電子郵件、聊天、電話以及社交媒體對客戶服務(wù)請求進(jìn)行個性化和本地化處理,從而為客服人員提供其所需的數(shù)據(jù),比如客戶母語表達(dá)中的情緒或意圖等,最終提升客戶服務(wù)體驗(yàn)。
為了讓大家用好生成式AI,亞馬遜云科技可謂操碎了心。這次大會上,Amazon Bedrock還發(fā)布了一系列的新技術(shù)和新功能:
全新的提示詞緩存功能和Amazon Bedrock Intelligent Prompt Routing提示詞智能路由功能,幫助客戶更輕松、更經(jīng)濟(jì)地?cái)U(kuò)展推理業(yè)務(wù)。Amazon Bedrock Knowledge Bases現(xiàn)已提供對結(jié)構(gòu)化數(shù)據(jù)和GraphRAG的支持,進(jìn)一步拓展了客戶利用自身數(shù)據(jù)提供定制化生成式AI體驗(yàn)的途徑。Amazon Bedrock Data Automation功能能夠在無需編寫代碼的情況下,自動將非結(jié)構(gòu)化、多模態(tài)的數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù),以幫助客戶將更多數(shù)據(jù)應(yīng)用于生成式AI及分析工作中。·模型蒸餾:創(chuàng)建更快、更具成本效益的模型,經(jīng)過蒸餾的模型速度最高提升500%,成本最高降低75%。Automated Reasoning checks:防止因幻覺產(chǎn)生的事實(shí)性錯誤,提供糾正建議。Multi-agent collaboration:構(gòu)建、部署和編排多個agent,協(xié)同處理復(fù)雜的多步驟任務(wù)。亞馬遜云科技人工智能和數(shù)據(jù)部門副總裁Swami Sivasubramanian博士表示:“通過此次新發(fā)布的一系列新功能,我們將幫助客戶開發(fā)出更智能的AI應(yīng)用程序,讓他們?yōu)槠渥罱K用戶創(chuàng)造更大價(jià)值?!?/p>
既提供了豐富的模型,又給了好用的功能,難怪有數(shù)以萬計(jì)的客戶通過Amazon Bedrock運(yùn)行其生成式AI應(yīng)用程序。僅僅在過去一年,使用Amazon Bedrock的客戶量就增長了4.7倍。如今,Adobe、Argo Labs、寶馬集團(tuán)、Octus、Symbeo、Tenovos和Zendesk等公司,都已經(jīng)采用了Amazon Bedrock的最新技術(shù)。
基礎(chǔ)設(shè)施層:三大領(lǐng)域一個都不能少
我們都知道,生成式AI要想獲得更廣泛的應(yīng)用,基礎(chǔ)設(shè)施肯定少不了。從2024亞馬遜云科技re:Invent全球大會上,老冀發(fā)現(xiàn)亞馬遜云科技在這方面同樣不含糊,在全面覆蓋基礎(chǔ)設(shè)施的計(jì)算、存儲、數(shù)據(jù)庫三大領(lǐng)域,為用戶提供全家桶的產(chǎn)品和服務(wù)。
先說計(jì)算。在這次大會上,亞馬遜云科技發(fā)布了以自研芯片Trainium搭建的AI算力。其中,Amazon Trainium2 Server采用16顆Trainium2 芯片,F(xiàn)P8算力達(dá)20.8PFLOPS;Amazon Trainium2 UltraServer則將4個Trn2實(shí)例通過NeuronLink互連,搭載64顆Trainium2 芯片,F(xiàn)P8算力達(dá)83.2PFLOPS。
在AI算力的超級競賽中,亞馬遜云科技正在加速創(chuàng)新。在本次大會上,亞馬遜云科技還宣布將與AI大模型的“當(dāng)紅炸子雞”Anthropic合作構(gòu)建一個名為“Project Rainier”的新集群,它將配備數(shù)十萬個亞馬遜云科技最新的AI訓(xùn)練芯片Trainium 2,建成后將比Anthropic當(dāng)前最強(qiáng)大模型的集群大五倍,成為全球最大的AI超級計(jì)算機(jī)之一,加入“十萬卡集群”的競爭。
亞馬遜云科技在計(jì)算上的強(qiáng)大實(shí)力,已經(jīng)吸引了很多重量級客戶的關(guān)注,蘋果公司AI和機(jī)器學(xué)習(xí)高級總監(jiān)Benoit Dupin也專程趕到2024亞馬遜云科技re:Invent全球大會站臺。他表示,蘋果與亞馬遜云科技在AI和機(jī)器學(xué)習(xí)生命周期的“幾乎所有階段”都展開了合作。如今,蘋果正在對Trainium 2芯片進(jìn)行初步測試,以幫助訓(xùn)練正在逐漸提供全面服務(wù)的Apple Intelligence。
此外,亞馬遜云科技還宣布將在2025年推出更先進(jìn)的自研Trainium3芯片,它將采用3nm先進(jìn)工藝,性能是上一代的2倍,功耗則只有上一代的40%。
有了自研的Trainium系列芯片,是不是就不再需要英偉達(dá)的GPU了?當(dāng)然不是。要知道,亞馬遜云科技始終從用戶的角度來考慮這個問題。Matt Garman表示:“今天,在GPU方面真的只有一個選擇,那就是英偉達(dá)。我們認(rèn)為客戶會欣賞有多個選擇。希望Trainium能夠開辟出一個良好的細(xì)分市場,我認(rèn)為它將成為部分工作負(fù)載的極佳選擇,當(dāng)然不是所有工作負(fù)載?!币虼?,在這次大會上,Matt Garman同樣發(fā)布了EC2 P6實(shí)例,它基于英偉達(dá)最先進(jìn)的Blackwell架構(gòu)GPU,是上一代性能的2.5倍。
用戶希望用什么架構(gòu)的計(jì)算,就給它好了;至于是自研還是合作伙伴的,并不那么重要。
在存儲上,亞馬遜云科技同樣也是用戶邏輯,在這次大會上發(fā)布了Amazon S3 Tables,將Apache Iceberg表的查詢性能提升3倍,每秒事務(wù)處理量提升10倍,還發(fā)布了Amazon S3 Metadata,提供S3中管理元數(shù)據(jù)最簡單快捷的方式。
用戶更大的驚喜,則來自于數(shù)據(jù)庫。我們知道,在分布式數(shù)據(jù)庫系統(tǒng)中,存在一個“CAP魔咒”——跨區(qū)域一致(Consistency)、高可用性(Availability )、低延遲(Partition Tolerance)這三大要求,一般只能滿足兩個。
而在這次大會上發(fā)布的新型無服務(wù)器分布式數(shù)據(jù)庫Amazon Aurora DSQL卻告訴用戶:三個要求都可以有!它結(jié)合了傳統(tǒng)關(guān)系數(shù)據(jù)庫的強(qiáng)一致性和NoSQL數(shù)據(jù)庫的分布式擴(kuò)展能力,提供了以下幾大關(guān)鍵優(yōu)勢:
跨區(qū)域強(qiáng)一致性和低延遲:采用了全新的架構(gòu),使其能夠在多個地理區(qū)域中同時(shí)運(yùn)行,而保持強(qiáng)一致性。無限擴(kuò)展:能夠處理數(shù)TB到數(shù)PB級的數(shù)據(jù)集,適用于任何規(guī)模的企業(yè)。超高可用性:提供99.999%的可用性,這對于許多需要高可用性和無縫運(yùn)行的企業(yè)級應(yīng)用至關(guān)重要。性能優(yōu)越:其跨區(qū)域的讀寫操作比Spanner快了四倍。從2024亞馬遜云科技re:Invent全球大會上,老冀看到了亞馬遜云科技對用戶的寵愛模式:說吧,你想要什么?我全都給你!
應(yīng)用層:軟件開發(fā)流程一步步搞定
作為一家平臺級公司,亞馬遜云科技從來都非常重視開發(fā)者的重要作用。在2024亞馬遜云科技re:Invent全球大會上, Matt Garman深情地回顧,今年6月他就任CEO之后的第一件頭等大事,就是與亞馬遜云科技Heroes交流,聽取這些技術(shù)專家們的意見。此時(shí),臺下傳來了一陣陣歡呼聲。
這一次,為了讓開發(fā)者們把AI更好地用起來,亞馬遜云科技針對軟件開發(fā)功能強(qiáng)大的生成式AI助手Amazon Q Developer繼續(xù)發(fā)力,推出一系列創(chuàng)新增強(qiáng)功能,包括能夠?qū)崿F(xiàn)自動執(zhí)行單元測試、文檔生成和代碼審查流程的智能體,可大幅提升開發(fā)人員在整個軟件開發(fā)流程中的效率;以及能夠在極短時(shí)間內(nèi)幫助用戶解決運(yùn)營難題的能力。
編寫單元測試對于保障代碼按預(yù)期運(yùn)行并及早發(fā)現(xiàn)潛在問題至關(guān)重要。Amazon Q Developer能夠自主識別并生成單元測試,通過全面的測試覆蓋,以更少時(shí)間幫助開發(fā)人員及早發(fā)現(xiàn)問題并顯著提升代碼的可靠性。
開發(fā)人員在代碼編寫和測試階段之后,通常需要編寫文檔來闡述代碼的功能與運(yùn)行機(jī)制。如今,開發(fā)人員可以使用 Amazon Q Developer 生成和維護(hù)其所有項(xiàng)目文檔,確保他們始終掌握項(xiàng)目的最新信息;同時(shí)讓他們能夠快速上手新代碼,為團(tuán)隊(duì)成員抓取關(guān)鍵的項(xiàng)目細(xì)節(jié),并提升舊文檔的可讀性。
代碼正式部署之前,往往需要另一位開發(fā)人員對代碼進(jìn)行細(xì)致檢查,確保其符合企業(yè)要求的質(zhì)量、風(fēng)格與安全標(biāo)準(zhǔn)。Amazon Q Developer具備自動檢查代碼質(zhì)量、查重和識別安全漏洞的能力,從而簡化代碼審查流程。它能夠迅速向開發(fā)人員提供反饋,讓開發(fā)人員在當(dāng)前工作流程下,加速部署高質(zhì)量的代碼。
當(dāng)應(yīng)用程序編寫完畢并投入生產(chǎn)環(huán)境后,運(yùn)營團(tuán)隊(duì)便肩負(fù)起監(jiān)控其運(yùn)行狀況、迭代優(yōu)化及解決問題的重任,以確保應(yīng)用性能達(dá)到預(yù)期標(biāo)準(zhǔn)?;趤嗰R遜云科技豐富的運(yùn)營經(jīng)驗(yàn)及對企業(yè)和組織的云資源關(guān)系的深入理解,Amazon Q Developer現(xiàn)在可以幫助不同經(jīng)驗(yàn)水平的用戶,以更短的時(shí)間調(diào)查并解決其在亞馬遜云科技環(huán)境中的運(yùn)營問題,確保企業(yè)應(yīng)用程序的正常運(yùn)行。
正如亞馬遜云科技下一代開發(fā)者體驗(yàn)副總裁Deepak Singh所言,亞馬遜云科技的客戶正廣泛通過Amazon Q Developer,在軟件開發(fā)生命周期各階段提升開發(fā)人員的生產(chǎn)力。如今,埃森哲、Boomi、BT Group、Cedar Gate Technologies、德勤、FINRA、Genesys、Netsmart、培生、SmugMug以及Tata Consultancy Services等眾多企業(yè),都正在使用Amazon Q Developer來提升開發(fā)人員的工作效率,并快速解決運(yùn)營挑戰(zhàn)。
看完2024亞馬遜云科技re:Invent全球大會的直播之后,老冀突然發(fā)現(xiàn),即使是在日新月異的生成式AI領(lǐng)域,亞馬遜云科技仍然能夠憑借自身多年的積累,為企業(yè)客戶提供豐富多樣的全家桶產(chǎn)品和服務(wù),幫助企業(yè)把AI用起來,用成功。這樣的亞馬遜云科技,必然也將成為企業(yè)客戶應(yīng)用生成式AI的首選合作伙伴。
*前述特定亞馬遜云科技生成式人工智能相關(guān)的服務(wù)僅在亞馬遜云科技海外區(qū)域可用,亞馬遜云科技中國僅為幫助您發(fā)展海外業(yè)務(wù)和/或了解行業(yè)前沿技術(shù)選擇推薦該服務(wù)。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 美國“對等關(guān)稅”坑慘蘋果:每年損失330億美元,產(chǎn)業(yè)鏈大逃殺
- 368元吸氧一小時(shí)?中年男人愛上高壓氧,店主:他們手里有錢
- 產(chǎn)業(yè)互聯(lián)網(wǎng),一次B端和C端的雙向奔赴
- 奇富科技與香港特區(qū)政府簽約成為重點(diǎn)企業(yè)
- 全網(wǎng)吹爆的大模型家電,真的值得種草嗎?
- 鏖戰(zhàn)企業(yè)級市場,AI Agent如何重塑智能商業(yè)未來?
- 阿里、騰訊們用AI讓產(chǎn)業(yè)互聯(lián)網(wǎng)「成真」
- 劉興亮 | 記一位突然離去的多年老友
- 海信視像營收利潤雙增!AI是王牌,還是賭局?
- 關(guān)稅嚇人,美國人搶購中國商品,蘋果慌了,緊急包機(jī)運(yùn)iPhone
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。