極客網(wǎng)·人工智能10月19日 在日前舉辦的Ignite 2022大會(huì)上,微軟宣布OpenAI的技術(shù)將與Azure云平臺(tái)進(jìn)行另一次整合,部分受邀客戶現(xiàn)在可以通過OpenAI Services注冊使用DALL-E2。
DALL-E2是今年流行的幾種文本到圖像AI生成模型之一,其生成圖像的結(jié)果令人印象深刻,以至于許多行業(yè)組織和藝術(shù)家都在考慮使用它來創(chuàng)作原創(chuàng)藝術(shù)。
DALL-E的快速拓展,標(biāo)志著微軟與OpenAI的長期合作關(guān)系不斷深入,也標(biāo)志著生成式AI模型市場日益成熟。
DALL-E及其競爭對手
OpenAI在今年4月發(fā)布了DALL-E2,并將其作為付費(fèi)API服務(wù)推出。不久之后,谷歌公司發(fā)布了Imagen,這是另一個(gè)同樣令人印象深刻的文本到圖像生成器。然而,一個(gè)重大的游戲規(guī)則改變者是Stability.ai公司在8月份發(fā)布的“Stable Diffusion”,其與DALL-E2不同,作為一款開源工具,每個(gè)人都可以下載和運(yùn)行Stable Diffusion。
需要明確的是,Stable Diffusion本身并不是OpenAI的DALL-E2 API的直接競爭對手,因?yàn)樗皇且粋€(gè)成型的最終應(yīng)用。但是,建立和運(yùn)行這個(gè)模型并不是特別困難,任何具有深度學(xué)習(xí)知識(shí)和適當(dāng)資源的開發(fā)人員都可以推出自己的Stable Diffusion服務(wù)。因此Stable Diffusion的開源模式為定制和開發(fā)新應(yīng)用程序開辟了道路。
自從發(fā)布以來,Stable Diffusion已經(jīng)成為研究和開發(fā)新產(chǎn)品的基礎(chǔ)。許多研究人員將其用于不同的應(yīng)用。另一方面,開發(fā)者已經(jīng)通過其API訪問了Hugging Face和其他平臺(tái)。
這顯然給OpenAI帶來了難題,并給它施加了難以維持市場優(yōu)勢的壓力。8月下旬,OpenAI在DALL-E2中添加了Outpainting功能,該功能也在Stable Diffusion中得到了應(yīng)用。
但這些舉措都沒有為OpenAI提供長期抵御競爭對手的能力。毫無疑問,文本到圖像生成器模型有著巨大的市場發(fā)展?jié)摿?。而在這個(gè)新興市場中,競爭很快在不同的層面上轉(zhuǎn)移。
起初OpenAI是市場上唯一的參與者,它可以為可用性、功能和定價(jià)設(shè)定標(biāo)準(zhǔn)。但Stable Diffusion和潛在的新玩家的進(jìn)入引發(fā)了功能、價(jià)格和便利性方面的競爭,這或許可以解釋OpenAI比GPT-3更快地消除DALL-E 2限制的原因。
這就是微軟發(fā)揮其突出作用的地方。
微軟Azure上的DALL-E2
微軟在一篇博客文章中詳細(xì)介紹了DALL-E2在其產(chǎn)品中的集成。其圖像生成器將添加到Azure OpenAI服務(wù)中,該服務(wù)于2021推出,允許Azure客戶訪問GPT-3等OpenAI深度學(xué)習(xí)模型。
這篇博文指出,“DALL?E2的加入建立在微軟和OpenAI正在進(jìn)行的合作基礎(chǔ)上,擴(kuò)展了Azure OpenAI Service中的用例范圍,這是Azure認(rèn)知服務(wù)系列中目前正在預(yù)覽的最新版本,它提供了Microsoft Azure內(nèi)置的安全性、可靠性、合規(guī)性、數(shù)據(jù)隱私和其他企業(yè)級(jí)功能?!?/p>
對于在采用新解決方案之前需要驗(yàn)證行業(yè)標(biāo)準(zhǔn)和合規(guī)性的企業(yè)來說,這可能是一個(gè)重要因素。
微軟還將DALL-E2添加到其他產(chǎn)品中,其中包括Designer,這是一個(gè)即將推出的用于創(chuàng)建社交媒體帖子、邀請、數(shù)字明信片、圖形等的工具。它還將把DALL-E2與必應(yīng)(Bing)的圖像創(chuàng)建器(Image Creator)集成在一起。而必應(yīng)是一個(gè)可以讓人們在網(wǎng)絡(luò)上搜索圖像或根據(jù)搜索查詢創(chuàng)建新圖像的工具。
這種整合策略對OpenAI和微軟來說都是一個(gè)雙贏的措施。在為他們的問題選擇解決方案時(shí),客戶會(huì)權(quán)衡不同的因素,并且根據(jù)用例和設(shè)置,偏好可能會(huì)有很大的不同。
例如,對于一家正在開發(fā)全新產(chǎn)品且以前沒有基礎(chǔ)設(shè)施的企業(yè)來說,OpenAI的API、Stable Diffusion和Azure OpenAI服務(wù)之間的差異可能并不顯著。但對于已經(jīng)在使用微軟云基礎(chǔ)設(shè)施的企業(yè)來說,Azure上的DALL-E將是一個(gè)更好的選擇。
微軟在企業(yè)領(lǐng)域擁有廣泛而深入的影響力,與不同行業(yè)的大型公司合作。對于其中許多客戶來說,Azure上的DALL-E將是一個(gè)更方便的選擇。微軟在博文中提供了一個(gè)企業(yè)客戶端示例,該客戶端使用Azure上的DALL-E設(shè)計(jì)玩具或?yàn)樾峦婢呱蓜?chuàng)意。
在開發(fā)人員、藝術(shù)家和組織都在探索如何將DALL-E投入生產(chǎn)使用的時(shí)候,展示真實(shí)的案例研究對鞏固微軟和OpenAI在這個(gè)快速發(fā)展的市場的企業(yè)細(xì)分市場中的地位大有裨益。
除此之外,微軟還與OpenAI的技術(shù)進(jìn)行了其他集成,包括GitHub Copilot和Microsoft Power Apps。
微軟與OpenAI的關(guān)系
微軟與OpenAI的合作始于2019年。微軟向OpenAI投資了10億美元,以換取OpenAI技術(shù)的獨(dú)家許可。從那時(shí)起,OpenAI就關(guān)閉了一些深度學(xué)習(xí)模型,并且只能通過付費(fèi)API訪問。與此同時(shí),微軟已經(jīng)從其協(xié)議中獲益,該協(xié)議將GPT-3、Codex以及現(xiàn)在的DALL-E等模型集成到其現(xiàn)有產(chǎn)品中。
兩家公司都將從這一合作關(guān)系中受益。微軟獨(dú)家獲得OpenAI的尖端技術(shù),有助于提高其產(chǎn)品的價(jià)值,并向其廣泛的企業(yè)客戶網(wǎng)絡(luò)大規(guī)模提供人工智能服務(wù)。另一方面,OpenAI獲得了對微軟計(jì)算資源的訪問補(bǔ)貼,并通過與微軟計(jì)算產(chǎn)品的集成和訪問其客戶,使其快速實(shí)現(xiàn)盈利。
但這種合作也可能讓OpenAI付出代價(jià)。OpenAI成立于2015年,當(dāng)時(shí)成立純粹出于科學(xué)目的,一直在為其主要資金支持者的利益而努力開發(fā)。但在開展科學(xué)研究和商業(yè)開發(fā)產(chǎn)品之間保持平衡非常困難。隨著OpenAI越來越依賴與微軟的合作獲得收入,如果這種平衡被打破可能會(huì)加劇雙方之間的沖突。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )