乱码一二三亚洲区,少妇人妻系列久久,国产av在

“中美AI差距究竟有幾年？”這個問題困擾了不少人，也有很多聲音嘗試將中美AI實(shí)力進(jìn)行比較。其中，算法，一定是評判的首要標(biāo)準(zhǔn)。

中美AI算法究竟是什么水平？我們可以用“第七個燒餅”來理解。

ChatGPT就是AI的“第七個燒餅”。深度學(xué)習(xí)算法的熱潮持續(xù)了十多年，終于在LLM（大語言模型）智能涌現(xiàn)之后，看到了實(shí)現(xiàn)通用人工智能的曙光。就像一個饑餓的人，連續(xù)吃了六個燒餅都沒吃飽，直到吃完了第七個燒餅，終于覺得飽了。

OpenAI為代表的美國企業(yè)，在底層研發(fā)和核心算法上占據(jù)領(lǐng)先地位，率先吃到了LLM的“第七個燒餅”。隨后，中國也極速跟進(jìn)了這個領(lǐng)域，很快推出了對標(biāo)ChatGPT、GPT-4水平的算法模型。

對此，有人欣慰：咱們雖然晚了一步，但也吃到了“第七塊燒餅”（中國沒有錯過大模型的機(jī)會）。

有人憤怒：這一次技術(shù)突破又是美國公司主導(dǎo)，它們肚子里可比我們多好幾塊燒餅?zāi)兀绹I(lǐng)先我們至少十年）。

有人迷惑：早知道吃第七個燒餅就能飽，前面六個都不應(yīng)該買（大模型之前的智能化探索全都白干了）。

還有人質(zhì)疑：中國根本沒有能力做燒餅，能吃上是因?yàn)閯e的攤主公開了做燒餅配方（谷歌Transformer、OpenAI GPT-1/GPT-2都是開源的）。

以上不同的情緒，有各自的道理，源于對算法的認(rèn)知不同。

《終極算法》一書的作者寫道：在農(nóng)業(yè)中，人類進(jìn)行播種，確保種子有足夠的水分和營養(yǎng)，然后收割成熟的作物，而這也是機(jī)器學(xué)習(xí)的承諾。算法是種子，數(shù)據(jù)是土壤，程序是成熟的作物。

算法，就是將大規(guī)模數(shù)據(jù)轉(zhuǎn)換成更合理、更智能決策的復(fù)雜程序，模型是它的軟件形態(tài)。算法模型，是AI產(chǎn)學(xué)界最重要的“收成”。

從這個角度看，簡單對比中美誰先拿下ChatGPT，其實(shí)并沒有太大意義。大眾真正關(guān)心的，是中國有沒有讓算法這顆“種子”播種、生根、成長、結(jié)果的能力，能不能確保中國接下來吃到新算法的第八塊、第九塊……乃至第N塊 “燒餅”，持續(xù)滿足各行各業(yè)享用AI的需求？

要搞清楚這個問題，我們得回到第三次AI浪潮的肇始，回到深度學(xué)習(xí)算法這顆“種子”剛剛萌芽的時候，看它是如何在中國落地生根的。

今天我們已經(jīng)知道，深度學(xué)習(xí)是聯(lián)結(jié)學(xué)派的主算法，主導(dǎo)了第三次AI浪潮。

可問題是，深度學(xué)習(xí)并不是在2011年才橫空出世的概念。早在20世紀(jì)40-60年代，深度學(xué)習(xí)的雛形就出現(xiàn)在控制論中。訓(xùn)練多層神經(jīng)網(wǎng)絡(luò)的關(guān)鍵技術(shù)反向傳播算法，是1986年提出的。聯(lián)結(jié)學(xué)派，在2006年開始復(fù)興。

那為什么，深度學(xué)習(xí)在2011年左右，才正式掀起了AI的新高潮呢？

背后有三個要素，構(gòu)成了深度學(xué)習(xí)“種子萌芽”的土壤：

越來越多的數(shù)據(jù)量。深度學(xué)習(xí)算法的中心思想，就是將大量計(jì)算單元連接在一起來實(shí)現(xiàn)智能行為，這個多層神經(jīng)網(wǎng)絡(luò)就類似于大腦的神經(jīng)元，依靠大數(shù)據(jù)進(jìn)行學(xué)習(xí)和訓(xùn)練，而互聯(lián)網(wǎng)、智能手機(jī)提供了較好的數(shù)據(jù)基礎(chǔ)，2011年谷歌大腦成功識別了一只貓，2012年蘋果推出了Siri，成為深度學(xué)習(xí)算法的先行者。

2.越來越低的錯誤率，或者說越來越好的模型效果。2012年，多層神經(jīng)網(wǎng)絡(luò)Alex Net在ImageNet 大型視覺識別挑戰(zhàn)（ILSVRC）中獲得冠軍，并大幅超越了使用傳統(tǒng)機(jī)器學(xué)習(xí)算法的第二名，此后，深度學(xué)習(xí)每年都贏，證明了該算法的有效性。

3.越來越多的成功應(yīng)用，深度學(xué)習(xí)這逐步成為主導(dǎo)算法，被工業(yè)界用來解決很多實(shí)際問題，與上一代智能產(chǎn)品和應(yīng)用相結(jié)合，讓一度停滯不前的語音識別、圖像識別、NLP等任務(wù)都得到了提高。

大數(shù)據(jù)、技術(shù)能力、智能產(chǎn)品，當(dāng)時在中國，具備讓深度學(xué)習(xí)萌芽的條件嗎？有兩股力量可以。一是以BAT為代表的互聯(lián)網(wǎng)公司，一是科大訊飛為代表的早期AI公司。

BAT為代表的中國互聯(lián)網(wǎng)公司，擁有海量數(shù)據(jù)以及國際化視野與人才團(tuán)隊(duì)，同時有搜索、語音、電商等數(shù)字化業(yè)務(wù)與應(yīng)用，擁抱深度學(xué)習(xí)這一新算法是必然。

2010年，百度成立自然語言處理部，由現(xiàn)任CTO王海峰帶領(lǐng)，開始在語言與知識技術(shù)上布局，提出了“自然語言立足中國、面向世界一流水平”的定位。2012年，百度積極關(guān)注并接觸深度學(xué)習(xí)領(lǐng)域的領(lǐng)軍人物Geoffrey Hinton，并于2013年建立了IDL深度學(xué)習(xí)研究院，2014年又成立了大數(shù)據(jù)實(shí)驗(yàn)室BDL、硅谷人工智能實(shí)驗(yàn)室SVAIL。除此之外，騰訊也在2012年成立了優(yōu)圖實(shí)驗(yàn)室，阿里巴巴成立了iDST（數(shù)據(jù)科學(xué)與技術(shù)研究院）。

另一支探索路線，則是科大訊飛為代表的早期AI公司。

這些公司大多是中國在智能領(lǐng)域的早期探索者，比如科大訊飛成立于1999年，創(chuàng)始人團(tuán)隊(duì)主要來自中科大電子工程系人機(jī)語音通信實(shí)驗(yàn)室。

在2011年之前，科大訊飛就以智能語音技術(shù)為核心，進(jìn)行了一系列技術(shù)、產(chǎn)品探索，比如科大訊飛聯(lián)合高校開發(fā)的復(fù)雜語音合成、語音識別引擎，就打破了海外廠商的壟斷，其語音軟件在教育、電信、金融、學(xué)習(xí)機(jī)等領(lǐng)域都有商用。隨著深度學(xué)習(xí)算法在國際上嶄露鋒芒，科大訊飛有意愿、有能力、有場景，將深度學(xué)習(xí)與原有的智能語音業(yè)務(wù)相融合。在2011年上線了中文語音識別DNN系統(tǒng)，2014年啟動了“訊飛超腦計(jì)劃”，探索讓“計(jì)算機(jī)能理解會思考”的感知智能和認(rèn)知智能。

2023年，面對“中國何時能有類ChatGPT”“中美AI技術(shù)代差十年、三十年”的焦慮情緒， BAT、科大訊飛等企業(yè)作為中國大模型的第一梯隊(duì)，很快帶來了文心、混元、通義、星火等基礎(chǔ)大模型。當(dāng)然不是靠摘開源的“果子”，而是深度學(xué)習(xí)算法的“種子”，萌芽之初，就扎根在中國AI的土地上，并持續(xù)生長。

深度卷積神經(jīng)網(wǎng)絡(luò)（CNN）在圖像識別和其他視覺任務(wù)中的突出表現(xiàn)，拉開了AI 1.0階段的帷幕。

具體來說，此前傳統(tǒng)的機(jī)器學(xué)習(xí)算法，雖然識別的精度和準(zhǔn)確率也在提升，但始終無法同時保證準(zhǔn)確率和識別效率，難以達(dá)到應(yīng)用規(guī)模。而卷積神經(jīng)網(wǎng)絡(luò)CNN由于參數(shù)共享和稀疏連接，非常適合處理圖像數(shù)據(jù)，在大規(guī)模圖像數(shù)據(jù)上訓(xùn)練得到的深度卷積神經(jīng)網(wǎng)絡(luò)模型，可以不斷從底層特征中提取更高層的特征（機(jī)器看得懂），最終更好地進(jìn)行下游任務(wù)的處理（機(jī)器看得到）。

CNN為核心技術(shù)，在圖像識別、目標(biāo)檢測、圖像分割、圖像生成等算法方面，帶來了極大的進(jìn)步。2014年，香港中文大學(xué)團(tuán)隊(duì)讓機(jī)器在人臉識別任務(wù)上的表現(xiàn)第一次超越了人類，被認(rèn)為AI 1.0階段的里程碑事件。

疊加智慧城市、智能安防等概念的興趣，CV計(jì)算機(jī)視覺飛速發(fā)展，成為深度學(xué)習(xí)最成功的應(yīng)用領(lǐng)域。

這一階段，沐浴在新算法春風(fēng)中茁壯成長的，自然就是CV企業(yè)。

2014-2017三年間，曠視科技、商湯科技、依圖科技、云從科技相繼成立，依托于領(lǐng)先的計(jì)算機(jī)視覺技術(shù)，成為行業(yè)領(lǐng)導(dǎo)者和資本市場的寵兒，估值迅速上升，成為大家熟知的“CV四小龍”。它們的算法模型，被廣泛應(yīng)用在城市、安防、醫(yī)療影像、工業(yè)質(zhì)檢等領(lǐng)域。

當(dāng)然，除CV之外，我們也不能忽略深度學(xué)習(xí)算法在NLP、語音、自動駕駛等多個領(lǐng)域中的進(jìn)展，給許多行業(yè)帶來了發(fā)展動力。

比如長短期記憶網(wǎng)絡(luò)LSTM大幅提高了語音識別的準(zhǔn)確性，智能助手在這一時期內(nèi)得到了顯著的性能提升，海外的蘋果Siri、谷歌Google Assistant、亞馬遜Alexa、微軟Cortana等，國內(nèi)的百度小度、阿里天貓精靈等，被集成到多種智能終端軟硬件當(dāng)中，并開啟了以語音交互為核心的智能家居元年。

自然語言處理方面，循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）和LSTM被應(yīng)用于語言模型、情感分析、機(jī)器翻譯等NLP任務(wù)。比如，這一階段的機(jī)器翻譯，就從統(tǒng)計(jì)機(jī)器翻譯（SMT）進(jìn)入到NWT神經(jīng)機(jī)器翻譯時代，可以說是翻天覆地，中國的BAT（百度、阿里、騰訊）、科大訊飛、搜狗等公司，都在各自的產(chǎn)品中部署了NWT，大幅提升了在線翻譯的連貫性、準(zhǔn)確性和語感。

同時，深度學(xué)習(xí)還可以在感知和決策方面，為自動駕駛汽車提供支持，吸引了很多投資基金的興趣，進(jìn)入了快速發(fā)展的黃金時期。百度在2013年啟動了自動駕駛汽車項(xiàng)目，2017年推出了Apollo平臺，并出現(xiàn)了小馬智行等一批面向L4自動駕駛技術(shù)的初創(chuàng)公司。

總的來看，AI 1.0階段，深度學(xué)習(xí)算法取代了傳統(tǒng)機(jī)器學(xué)習(xí)算法，成為這一階段的主算法，為很多領(lǐng)域的AI任務(wù)帶來了跨越式發(fā)展。

但這一階段的算法模型開發(fā)，仍是“手工作坊模式”，坊間戲稱“有多少人工就有多少智能”。依靠對大量數(shù)據(jù)的依賴，需要組建龐大的標(biāo)注團(tuán)隊(duì)，模型泛化性不足，專為某個特定任務(wù)而設(shè)計(jì)，需要投入開發(fā)人員進(jìn)行大量重復(fù)開發(fā)和手工迭代優(yōu)化等。

從“手工業(yè)作坊”到“工業(yè)化AI工廠”，算法仍需一場嬗變。

凱文凱利說過，技術(shù)帶來的問題，只能靠技術(shù)進(jìn)步來解決，算法也不例外。

從AI開發(fā)，從過去的手工作坊式向工業(yè)化升級，預(yù)訓(xùn)練模型就是一條可以規(guī)?；a(chǎn)高性能AI模型的“工業(yè)生產(chǎn)線”。

2017年，谷歌在論文《Attenlion is All You Needs》提出了Transformer架構(gòu)。沒有使用上一階段流行的卷積神經(jīng)網(wǎng)絡(luò)CNN、循環(huán)神經(jīng)網(wǎng)絡(luò)RNN、長短期記憶網(wǎng)絡(luò)LSTM、GRU等結(jié)構(gòu)，僅使用了自注意（Self-attention）特性，引入了注意力機(jī)制和預(yù)訓(xùn)練模型（PTM）。在機(jī)器翻譯、機(jī)器閱讀、自動問答、情緒分析、自動摘要、語言建模等場景，顯現(xiàn)出了前所未有的能力。2018年，基于Transformer架構(gòu)的預(yù)訓(xùn)練語言模型BERT，刷新了11項(xiàng) NLP任務(wù)的最優(yōu)性能紀(jì)錄。同年，OpenAI推出了GPT-1。

基于Transformer架構(gòu)的預(yù)訓(xùn)練模型，可以通過模型的預(yù)先訓(xùn)練，帶來效果更好、質(zhì)量更高的算法模型，下游只需要任務(wù)微調(diào)就能應(yīng)用。這種“預(yù)制菜”一樣的“工業(yè)化模式”，一改小模型定制的積弊，讓大規(guī)模、可復(fù)制的AI應(yīng)用成為可能，成為AI去往下一個時代的必經(jīng)之路。

邁向預(yù)訓(xùn)練模型的這條路上，中國幾乎與世界一流水平同步，得益于一個關(guān)鍵變化：云智合流。

打造預(yù)訓(xùn)練模型，最困難的一項(xiàng)，就是專用算力不足，有的學(xué)校甚至買不起GPU卡，沒有AI算力用。同時，這一階段很多政企用戶加速上云，也希望智能化升級，以更便捷的方式獲取算法能力。

幸好，在這個算法更迭的關(guān)鍵窗口期，云+AI的融合基礎(chǔ)設(shè)施，已經(jīng)在建設(shè)中。

2017年，將AI技術(shù)作為核心能力的華為云誕生。2018年，百度云更名為百度智能云，阿里云升級為阿里云智能。將AI引入公有云的能力版圖，成為主流。

云智合流，讓AI開發(fā)從“手工業(yè)”邁入到“工業(yè)化”，將原本散落在算法全生命周期中的各類需求，進(jìn)行了“融合”：

1.算力融合。預(yù)訓(xùn)練模型不僅需要龐大規(guī)模的異構(gòu)算力，而且需要高度的靈活性，從訓(xùn)練到推理的每個步驟，所需要的算力是差異巨大的。通過云廠商的基礎(chǔ)設(shè)施，企業(yè)可以彈性、靈活、按需取用地接入多樣、充沛的AI算力。獲取算力的方式變得簡單、高效、低門檻了，這就讓更多人參與到AI算法模型的開發(fā)中來，進(jìn)入大規(guī)模生產(chǎn)階段。

2.流程融合。借助云廠商提供完整、全棧的AI能力和開發(fā)工具，包括預(yù)制數(shù)據(jù)集、模型庫、算子庫等，讓企業(yè)和開發(fā)者可以在云上完成從訓(xùn)練－開發(fā)－推理－部署的全部環(huán)節(jié)。比如百度智能云的EasyDL\BML平臺、華為云的AI開發(fā)生產(chǎn)線ModelArts等。

3.產(chǎn)品融合。時間來到2018年，智慧城市、智慧園區(qū)等都開始追求整體智能，希望構(gòu)建一體化、解決方案式的“AI大腦”，整合算法、芯片、云端算力、框架、網(wǎng)絡(luò)、IoT等軟硬件，實(shí)現(xiàn)智慧決策能力的質(zhì)變。這種情況下，云廠商和AI企業(yè)都要把自己變成一個“AI超市”，集成并供應(yīng)豐富的AI技術(shù)能力與應(yīng)用，讓行業(yè)用戶和開發(fā)者可以體系化、輕松地，獲取到所需要的AI能力。

比如百度智能云率先在業(yè)界提出了“云智一體，深入產(chǎn)業(yè)”的主張，發(fā)布了200多款產(chǎn)品和數(shù)十個解決方案，將百度AI技術(shù)釋放到金融、物流、工業(yè)、農(nóng)業(yè)等多個行業(yè)。華為云在2021年啟動盤古大模型，并在2022年聚焦行業(yè)應(yīng)用落地，基于盤古大模型的通用能力，打造了盤古氣象大模型、盤古礦山大模型、盤古電力大模型、盤古藥物分子大模型等。

可以說，云智合流，為中國AI跟上ChatGPT的大模型路線，奠定了基礎(chǔ)。

2023年以來，在海外算力形勢愈發(fā)嚴(yán)峻的背景下，國產(chǎn)預(yù)訓(xùn)練大模型依然實(shí)現(xiàn)了“井噴”，在文本處理、圖像生成、音視頻生成、多模態(tài)等各個任務(wù)中，都完成了占位。放眼全球，唯有中美這兩棵繁茂的AI“榕樹”。

讓深度學(xué)習(xí)算法的這顆“種子”，在中國扎根、生長、成熟，這本身就是一種能力的自證。

回顧深度學(xué)習(xí)的十多年歷程，或許某一種具體的算法會被更新更好的算法所取代，但這個雨打風(fēng)吹、反復(fù)更替的過程，也讓中國AI在時光中變得愈發(fā)堅(jiān)韌，積蓄了經(jīng)驗(yàn)、匯聚了人才、釋放了信心。

只要根深蒂固，任爾東西南北風(fēng)，中國AI都能在每一次技術(shù)趨勢中，生長出新的枝丫，結(jié)出產(chǎn)業(yè)期待的果實(shí)。

免責(zé)聲明：此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章，所有文字和圖片版權(quán)歸作者所有，且僅代表作者個人觀點(diǎn)，與極客網(wǎng)無關(guān)。文章僅供讀者參考，并請自行核實(shí)相關(guān)內(nèi)容。投訴郵箱：editor@fromgeek.com。

免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進(jìn)一步核實(shí)，并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

中國AI長卷（三）：算法生根

下一篇