百圖生科AIGP平臺發(fā)布:提供多種蛋白質生成能力,邀伙伴聯(lián)手開發(fā)“新物種”

近日,ChatGPT和文心一言等超大規(guī)模預訓練模型紛紛登場,讓我們看到了AI破解人類自然語言的力量。

成立兩年多以來,BioMap百圖生科一直致力于打造生命科學領域的AI大模型,構建了千億參數(shù)的跨模態(tài)大模型“xTrimo” (The Cross-Modal Transformer Representation of Interactome and Multi-Omics)。

該大模型從跨物種、跨模態(tài)的生命信息中學習蛋白質如何構成和實現(xiàn)功能、如何相互作用、如何組合和調(diào)控細胞功能的關鍵規(guī)律,從而破解生命的自然語言 —— 蛋白質?;诖竽P?AI在一系列任務算法上取得了明顯的進展,除了更好地完成結構預測等基礎任務外,也開始可以根據(jù)不同的問題輸入,以生成的方式,設計創(chuàng)新的蛋白質,來回答各種生命科學問題。

2023年3月23日,百圖生科在北京發(fā)布生命科學大模型驅動的AIGP —— AIGeneratedProtein平臺,旨在將這一技術平臺的能力與更多行業(yè)伙伴分享,利用AI設計創(chuàng)新蛋白質的能力,共同研發(fā)更多的前沿藥物和其他生命科學項目,也通過一系列挑戰(zhàn)性的新任務,驅動AIGP平臺的技術進步。

在發(fā)布前,AIGP平臺已經(jīng)進行了一段時間的內(nèi)部測試,在百圖生科內(nèi)部承載了其創(chuàng)新免疫調(diào)控藥物ImmuBot的研發(fā)工作,貢獻了多個高性能彈頭、新功能傳感器的研發(fā)案例。

除此之外,有近20家合作伙伴和百圖生科開展了AIGP聯(lián)合研發(fā)合作,方向覆蓋高性能彈頭設計、新功能蛋白質設計、靶點挖掘和調(diào)控蛋白設計等領域,其中多個項目取得了階段性的發(fā)現(xiàn)成果。在合作的創(chuàng)新藥企、學術PI的幫助下,AIGP平臺也進行了諸多優(yōu)化。

因此,本次百圖生科AIGP平臺的對外發(fā)布,實際意味著對平臺創(chuàng)新蛋白質的生成能力開啟“公測”新階段,也意味著百圖生科AIGP平臺將為更多伙伴,包括科研、環(huán)保、材料、消費等更多場景的需求,提供解決方案。

圖: AIGP 3大功能模塊+12項核心能力示意圖

目前,百圖生科AIGP平臺設置了3類功能模塊,分別是Function to Protein Design(F2P,根據(jù)結構、功能、可開發(fā)性等功能指標設計/優(yōu)化蛋白質)、Protein to Protein Design(P2P,給定抗原等目標蛋白,設計與之以特定方式結合的抗體等蛋白),以及Cell to Protein Design(C2P,給定細胞,發(fā)現(xiàn)調(diào)控細胞功能的靶點蛋白并設計相應的調(diào)控蛋白)。

根據(jù)不同模塊的輸入和要求,AIGP平臺可在較短時間內(nèi)設計和生成具有特定性質的蛋白質。

隨著面向合作伙伴的公測階段取得進展,百圖生科計劃于2023年6月起將部分功能模塊進一步開放,讓專業(yè)用戶可以直接自主使用,在更多的研究場景調(diào)用AI的蛋白質生成能力,激發(fā)更多的生命科學探索。

對于百圖生科AIGP平臺的發(fā)布,世界生物信息學界的著名學者、哈佛計算生物醫(yī)學中心創(chuàng)始主任、R語言的主要發(fā)明人、百圖生科科學顧問委員會委員Robert Gentleman教授表示,在哈佛,他的團隊同樣在進行蛋白質生成/預測模型的相關研究,“百圖生科在這個方向上走得很遠了”。

他期待,AIGP會帶來更多的蛋白質/抗體生成模型,抗體工程師們可能會從這些模型的預測中,發(fā)現(xiàn)自己從未注意過的細節(jié),“如果將這些模型視作‘ideagenerator’,一切會變得更加美妙”。

中國科學院院士、著名免疫學家董晨教授認為:“AI能夠解決的問題,就是對大數(shù)據(jù)的分析和進一步的演繹和應用。在當下的時間節(jié)點,AIGP確實是一個呼之欲出的平臺。相信AIGP對于我們理解蛋白質,以及在生物系統(tǒng)中研究和發(fā)現(xiàn)它的功能和調(diào)控,乃至于將來研發(fā)新藥,都會有非常大的作用。”

圖: 百圖生科CTO 宋樂博士

從AIGC到AIGP,人工智能的生成和預測能力對真實世界的影響將進一步加深。

而AIGP能力的背后,正是百圖生科在底層技術上的持續(xù)投入,以及與合作伙伴對前沿創(chuàng)新的共同追求。發(fā)布會上,百圖生科CTO宋樂博士對此進行了詳細介紹。

此前的媒體采訪中,宋樂博士也表示:“因為生命體的高度復雜度。目前數(shù)據(jù)量很大,但仍然是有限的。隨著生命科學領域觀測手段和技術的發(fā)展,將使我們能夠更加精細精準地理解進化,理解生命。這也就意味著,要實現(xiàn)這一目標,我們需要不斷吸納新的合作伙伴。”

正如百圖生科CEO劉維在本次發(fā)布活動所提到的,雖然百圖生科的AI大模型和與之配套的大規(guī)模數(shù)據(jù)圖譜、高通量驗證體系都遠不完美,但已經(jīng)凝結了很多前沿技術的創(chuàng)新和探索,接下來,從開始展露一些能力到提高它的泛化能力和速度,需要專業(yè)伙伴的合作的加入,而且,合作伙伴也將得益這一系列嘗試,實現(xiàn)前沿項目的加速研發(fā)。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )