9月24日,2025云棲大會(huì)正式啟幕!阿里巴巴集團(tuán)CEO、阿里云智能集團(tuán)董事兼CEO吳泳銘發(fā)表主旨演講,他認(rèn)為實(shí)現(xiàn)通用人工智能AGI已是確定性事件,但這只是起點(diǎn),終極目標(biāo)是發(fā)展出能自我迭代、全面超越人類的超級(jí)人工智能ASI。
AGI的目標(biāo)是將人類從80%的日常工作中解放出來(lái),讓我們專注于創(chuàng)造與探索。而ASI作為全面超越人類智能的系統(tǒng),將可能創(chuàng)造出一批“超級(jí)科學(xué)家”和"全棧超級(jí)工程師"。
ASI將以難以想象的速度,解決現(xiàn)在未被解決的科學(xué)和工程問(wèn)題,比如攻克醫(yī)學(xué)難題、發(fā)明新材料、解決可持續(xù)能源和氣候問(wèn)題,甚至星際旅行等等。ASI將以指數(shù)級(jí)的速度推動(dòng)科技的飛躍,引領(lǐng)我們進(jìn)入一個(gè)前所未有的智能時(shí)代。
通往ASI之路將經(jīng)歷三個(gè)階段——
第一階段是“智能涌現(xiàn)”,特征是“學(xué)習(xí)人”。過(guò)去幾十年的互聯(lián)網(wǎng)發(fā)展,為智能涌現(xiàn)提供了基礎(chǔ)。互聯(lián)網(wǎng)將人類歷史上幾乎所有的知識(shí)都數(shù)字化了。這些語(yǔ)言文字承載的信息,代表了人類知識(shí)的全集。
基于此,大模型首先通過(guò)理解全世界的知識(shí)集合,具備了泛化的智能能力,涌現(xiàn)出通用對(duì)話能力,可以理解人類的意圖,解答人類的問(wèn)題,并逐漸發(fā)展出思考多步問(wèn)題的推理能力。
現(xiàn)在,我們看到AI已經(jīng)逼近人類各學(xué)科測(cè)試的頂級(jí)水平,比如國(guó)際數(shù)學(xué)奧賽的金牌水平。AI逐漸具備了進(jìn)入真實(shí)世界、解決真實(shí)問(wèn)題、創(chuàng)造真實(shí)價(jià)值的可能性。這是過(guò)去幾年的主線。
第二個(gè)階段是“自主行動(dòng)”,特征是“輔助人”。這個(gè)階段,AI不再局限于語(yǔ)言交流,而是具備了在真實(shí)世界中行動(dòng)的能力。AI可以在人類的目標(biāo)設(shè)定下,拆解復(fù)雜任務(wù),使用和制作工具,自主完成與數(shù)字世界和物理世界的交互,對(duì)真實(shí)世界產(chǎn)生巨大影響。這正是我們當(dāng)下所處的階段。
實(shí)現(xiàn)這一跨越的關(guān)鍵,首先是大模型具備了Tool Use能力,有能力連接所有數(shù)字化工具,完成真實(shí)世界任務(wù)。人類加速進(jìn)化的起點(diǎn)是開(kāi)始創(chuàng)造和使用工具,現(xiàn)在大模型也具備了使用工具的能力。
通過(guò)Tool Use,AI可以像人一樣調(diào)用外部軟件、接口和物理設(shè)備,執(zhí)行復(fù)雜的真實(shí)世界任務(wù)。這個(gè)階段,由于AI能夠輔助人類極大提高生產(chǎn)力,它將快速的滲透到物流、制造、軟件、商業(yè)、生物醫(yī)療、金融、科研等幾乎所有行業(yè)領(lǐng)域。
其次,大模型Coding能力的提升,可以幫助人類解決更復(fù)雜的問(wèn)題,并將更多場(chǎng)景數(shù)字化。現(xiàn)在的Agent還比較早期,解決的主要是標(biāo)準(zhǔn)化和短周期的任務(wù)。要想讓Agent能解決更復(fù)雜、更長(zhǎng)周期任務(wù),最關(guān)鍵的是大模型的Coding能力。因?yàn)锳gent可以自主Coding,理論上就能解決無(wú)限復(fù)雜的問(wèn)題,像工程師團(tuán)隊(duì)一樣理解復(fù)雜需求并自主完成編碼、測(cè)試。發(fā)展大模型Coding能力是通往AGI的必經(jīng)之路。
未來(lái),自然語(yǔ)言就是AI時(shí)代的源代碼,任何人用自然語(yǔ)言就能創(chuàng)造自己的Agent。只需要輸入母語(yǔ),告訴AI你的需求,AI就能自己編寫(xiě)邏輯、調(diào)用工具、搭建系統(tǒng),完成數(shù)字世界的幾乎所有工作,并通過(guò)數(shù)字化接口來(lái)操作所有物理設(shè)備。
未來(lái),也許會(huì)有超過(guò)全球人口數(shù)量的Agent和機(jī)器人與人類一起工作,對(duì)真實(shí)世界產(chǎn)生巨大影響。在這個(gè)過(guò)程中,AI就能連接真實(shí)世界的絕大部分場(chǎng)景和數(shù)據(jù),為未來(lái)的進(jìn)化創(chuàng)造條件。
隨后AI將進(jìn)入第三個(gè)階段——“自我迭代”,特征是“超越人”。這個(gè)階段有兩個(gè)關(guān)鍵要素:
第一、AI連接了真實(shí)世界的全量原始數(shù)據(jù)
目前AI的進(jìn)步最快的領(lǐng)域是內(nèi)容創(chuàng)作、數(shù)學(xué)和Coding領(lǐng)域。我們看到這三個(gè)領(lǐng)域有明顯的特征。這些領(lǐng)域的知識(shí)100%是人類定義和創(chuàng)造的,都在文字里,AI可以100%理解原始數(shù)據(jù)。但是對(duì)于其他領(lǐng)域和更廣泛的物理世界,今天的AI接觸到的更多是人類歸納之后的知識(shí),缺乏廣泛的、與物理世界交互的原始數(shù)據(jù)。這些信息是有局限的。
AI要實(shí)現(xiàn)超越人類的突破,就需要直接從物理世界獲取更全面、更原始的數(shù)據(jù)。
舉一個(gè)簡(jiǎn)單的例子,比如一家汽車公司的CEO要迭代明年的產(chǎn)品,大概率會(huì)通過(guò)無(wú)數(shù)次的用戶調(diào)研或者內(nèi)部的討論來(lái)決定下一款汽車將要具備什么樣的功能,與競(jìng)對(duì)相比要實(shí)現(xiàn)哪些方面的長(zhǎng)板,保留什么方面的能力。現(xiàn)在AI要去做還是很難的,核心點(diǎn)在于它所獲得的數(shù)據(jù)和信息,全都是調(diào)研來(lái)的二手?jǐn)?shù)據(jù)。如果有一天AI有機(jī)會(huì),能夠連接這款汽車的所有的資料和數(shù)據(jù),它創(chuàng)造出來(lái)的下一款汽車會(huì)遠(yuǎn)遠(yuǎn)超過(guò)通過(guò)無(wú)數(shù)次頭腦風(fēng)暴所創(chuàng)作出來(lái)的。這只是人類世界當(dāng)中的一個(gè)例子,更何況更復(fù)雜的物理世界,遠(yuǎn)遠(yuǎn)不是通過(guò)人類知識(shí)歸納就能夠讓AI理解的。
就像在自動(dòng)駕駛的早期階段,只靠人類的總結(jié),Rule-based的方法去實(shí)現(xiàn)自動(dòng)駕駛,無(wú)法實(shí)現(xiàn)很好的效果。新一代的自動(dòng)駕駛,大部分采用端到端的訓(xùn)練方法,直接從原始的車載攝像頭數(shù)據(jù)中學(xué)習(xí),實(shí)現(xiàn)了更高水平的自動(dòng)駕駛能力。即便我們現(xiàn)在看起來(lái)相對(duì)簡(jiǎn)單的自動(dòng)駕駛問(wèn)題,僅依靠人類歸納的知識(shí)和規(guī)則,也無(wú)法解決,更何況整個(gè)復(fù)雜的物理世界。只是讓AI學(xué)習(xí)人類歸納的規(guī)律,是遠(yuǎn)遠(yuǎn)不夠的。
只有讓AI與真實(shí)世界持續(xù)互動(dòng),獲取更全面、更真實(shí)、更實(shí)時(shí)的數(shù)據(jù),才能更好的理解和模擬世界,發(fā)現(xiàn)超越人類認(rèn)知的深層規(guī)律,從而創(chuàng)造出比人更強(qiáng)大的智能能力。
第二、Self-learning自主學(xué)習(xí)
隨著AI滲透更多的物理世界場(chǎng)景,理解更多物理世界的數(shù)據(jù),AI 模型和agent能力也會(huì)越來(lái)越強(qiáng),有機(jī)會(huì)為自己模型的升級(jí)迭代搭建訓(xùn)練infra、優(yōu)化數(shù)據(jù)流程和升級(jí)模型架構(gòu),從而實(shí)現(xiàn) Self learning。這會(huì)是AI發(fā)展的關(guān)鍵時(shí)刻。
隨著能力的持續(xù)提升,未來(lái)的模型將通過(guò)與真實(shí)世界的持續(xù)交互,獲取新的數(shù)據(jù)并接收實(shí)時(shí)反饋,借助強(qiáng)化學(xué)習(xí)與持續(xù)學(xué)習(xí)機(jī)制,自主優(yōu)化、修正偏差、實(shí)現(xiàn)自我迭代與智能升級(jí)。每一次交互都是一次微調(diào),每一次反饋都是一次參數(shù)優(yōu)化。當(dāng)經(jīng)過(guò)無(wú)數(shù)次場(chǎng)景執(zhí)行和結(jié)果反饋的循環(huán),AI將自我迭代出超越人類的智能能力,一個(gè)早期的超級(jí)人工智能(ASI)便會(huì)成型。
一旦跨過(guò)某個(gè)奇點(diǎn),人類社會(huì)就像按下了加速鍵,科技進(jìn)步的速度將超越我們的想象,新的生產(chǎn)力爆發(fā)將推動(dòng)人類社會(huì)進(jìn)入嶄新的階段。這條通往超級(jí)人工智能的道路,在我們的眼前正在日益清晰。隨著AI技術(shù)的演進(jìn)和各行各業(yè)需求爆發(fā),AI也將催生IT產(chǎn)業(yè)的巨大變革。
我們的第一個(gè)判斷是:大模型是下一代的操作系統(tǒng)。我們認(rèn)為大模型代表的技術(shù)平臺(tái)將會(huì)替代現(xiàn)在OS的地位,成為下一代的操作系統(tǒng)。未來(lái),幾乎所有鏈接真實(shí)世界的工具接口都將與大模型進(jìn)行鏈接,所有用戶需求和行業(yè)應(yīng)用將會(huì)通過(guò)大模型相關(guān)工具執(zhí)行任務(wù),LLM將會(huì)是承載用戶、軟件 與 AI計(jì)算資源交互調(diào)度的中間層,成為AI時(shí)代的OS。
來(lái)做一些簡(jiǎn)單的類比:自然語(yǔ)言是AI時(shí)代的編程語(yǔ)言,Agent就是新的軟件,Context是新的Memory,大模型通過(guò)MCP這樣的接口,連接各類Tools和Agent類似PC時(shí)代的總線接口,Agent之間又通過(guò)A2A這樣的協(xié)議完成多Agent協(xié)作類似軟件之間的API接口。
大模型將會(huì)吞噬軟件。大模型作為下一代的操作系統(tǒng),將允許任何人用自然語(yǔ)言,創(chuàng)造無(wú)限多的應(yīng)用。未來(lái)幾乎所有與計(jì)算世界打交道的軟件可能都是由大模型產(chǎn)生的Agent,而不是現(xiàn)在的商業(yè)軟件。潛在的開(kāi)發(fā)者將從幾千萬(wàn)變成數(shù)億規(guī)模。以前由于軟件開(kāi)發(fā)的成本問(wèn)題,只有少量高價(jià)值場(chǎng)景才會(huì)被工程師開(kāi)發(fā)出來(lái)變成商業(yè)化的軟件系統(tǒng)。未來(lái)所有終端用戶都可以通過(guò)大模型這樣的工具來(lái)滿足自己的需求。
模型部署方式也會(huì)多樣化,它將運(yùn)行在所有設(shè)備上。現(xiàn)在主流的調(diào)用模型API的方式,來(lái)使用模型只是初級(jí)階段,其實(shí)看起來(lái)非常原始。類似大型主機(jī)時(shí)代的分時(shí)復(fù)用階段,每個(gè)人只有一個(gè)終端連接上大型主機(jī)分時(shí)復(fù)用。這種方式無(wú)法解決數(shù)據(jù)持久化,缺乏長(zhǎng)期記憶,實(shí)時(shí)性不夠,隱私無(wú)法解決,可塑性也不夠。未來(lái)模型將運(yùn)行在所有計(jì)算設(shè)備中,并具備可持久記憶,端云聯(lián)動(dòng)的運(yùn)行狀態(tài),甚至可以隨時(shí)更新參數(shù),自我迭代,類似我們今天的OS運(yùn)行在各種環(huán)境之中。
正是基于這個(gè)判斷,我們做了一個(gè)戰(zhàn)略選擇:通義千問(wèn)選擇開(kāi)放路線,打造AI時(shí)代的Android。我們認(rèn)為在LLM時(shí)代,開(kāi)源模型創(chuàng)造的價(jià)值和能滲透的場(chǎng)景,會(huì)遠(yuǎn)遠(yuǎn)大于閉源模型。我們堅(jiān)定選擇開(kāi)源,就是為了全力支持開(kāi)發(fā)者生態(tài),與全球所有開(kāi)發(fā)者一起探索AI應(yīng)用的無(wú)限可能。
我們的第二個(gè)判斷:超級(jí)AI云是下一代的計(jì)算機(jī)。
大模型是運(yùn)行于 AI Cloud之上新的OS。這個(gè)OS可以滿足任何人的需求。每個(gè)人都將擁有幾十甚至上百個(gè)Agent,這些Agent 24小時(shí)不間斷地工作和協(xié)同,需要海量的計(jì)算資源。
數(shù)據(jù)中心內(nèi)的計(jì)算范式也在發(fā)生革命性改變,從CPU為核心的傳統(tǒng)計(jì)算,正在加速轉(zhuǎn)變?yōu)橐?GPU為核心的 AI 計(jì)算。新的AI計(jì)算范式需要更稠密的算力、更高效的網(wǎng)絡(luò)、更大的集群規(guī)模。
這一切都需要充足的能源、全棧的技術(shù)、數(shù)百萬(wàn)計(jì)的GPU和CPU,協(xié)同網(wǎng)絡(luò)、芯片、存儲(chǔ)、數(shù)據(jù)庫(kù)高效運(yùn)作,并且24 小時(shí)處理全世界各地的需求。這需要超大規(guī)模的基礎(chǔ)設(shè)施和全棧的技術(shù)積累,只有超級(jí)AI云才能夠承載這樣的海量需求。未來(lái),全世界可能只會(huì)有5-6個(gè)超級(jí)云計(jì)算平臺(tái)。
在這個(gè)新時(shí)代,AI將會(huì)替代能源的地位,成為最重要的商品,驅(qū)動(dòng)千行百業(yè)每天的工作。絕大部分AI能力將以Token的形式在云計(jì)算網(wǎng)絡(luò)上產(chǎn)生和輸送。Token就是未來(lái)的電。
在這個(gè)嶄新的時(shí)代,阿里云的定位是全棧人工智能服務(wù)商,提供世界領(lǐng)先的智能能力和遍布全球的AI云計(jì)算網(wǎng)絡(luò),向全球各地提供開(kāi)發(fā)者生態(tài)友好的AI服務(wù)。
首先,我們有全球領(lǐng)先的大模型——通義千問(wèn)。通義千問(wèn)開(kāi)源了300多款模型,覆蓋了全模態(tài)、全尺寸,是最受全球開(kāi)發(fā)者歡迎的開(kāi)源模型。截至目前,通義千問(wèn)全球下載量超6億次,衍生模型超17萬(wàn)個(gè),是全球第一的開(kāi)源模型矩陣,可以說(shuō)是滲透計(jì)算設(shè)備最廣泛的大模型。
同時(shí),阿里云提供一站式模型服務(wù)平臺(tái)百煉,支持模型定制化以及Agent快速開(kāi)發(fā),同時(shí)提供AgentBay這樣的Agent運(yùn)行環(huán)境、靈碼/Qoder等一系列開(kāi)發(fā)者套件,讓開(kāi)發(fā)者可以方便地使用模型能力和創(chuàng)建使用Agent。
其次,阿里云運(yùn)營(yíng)著中國(guó)第一、全球領(lǐng)先的AI基礎(chǔ)設(shè)施和云計(jì)算網(wǎng)絡(luò),是全球少數(shù)能做到軟硬件垂直整合的超級(jí)AI云計(jì)算平臺(tái)之一。在硬件和網(wǎng)絡(luò)層面,阿里云自研的核心存儲(chǔ)系統(tǒng)、網(wǎng)絡(luò)架構(gòu)、計(jì)算芯片,構(gòu)成了阿里云大型計(jì)算集群最堅(jiān)實(shí)的底座。
阿里云正在全力打造一臺(tái)全新的AI超級(jí)計(jì)算機(jī),它同時(shí)擁有最領(lǐng)先的AI基礎(chǔ)設(shè)施和最領(lǐng)先的模型,可以在基礎(chǔ)架構(gòu)設(shè)計(jì)和模型架構(gòu)上協(xié)同創(chuàng)新,從而確保在阿里云上調(diào)用和訓(xùn)練大模型時(shí),能達(dá)到最高效率,成為開(kāi)發(fā)者最好用的AI云。
AI行業(yè)發(fā)展的速度遠(yuǎn)超我們的預(yù)期,行業(yè)對(duì)AI基礎(chǔ)設(shè)施的需求也遠(yuǎn)超我們的預(yù)期。我們正在積極推進(jìn)三年3800億的AI基礎(chǔ)設(shè)施建設(shè)計(jì)劃,并將會(huì)持續(xù)追加更大的投入。
從現(xiàn)在我們看到的AI行業(yè)遠(yuǎn)期發(fā)展以及客戶需求角度來(lái)看,為了迎接ASI時(shí)代的到來(lái),對(duì)比2022年這個(gè)GenAI的元年,2032年阿里云全球數(shù)據(jù)中心的能耗規(guī)模將提升10倍。這是我們的一個(gè)遠(yuǎn)期規(guī)劃,我們相信通過(guò)這樣的飽和式投入,能夠推動(dòng)AI行業(yè)的發(fā)展,迎接ASI時(shí)代的到來(lái)。
阿里云重磅升級(jí)全棧AI體系
云棲大會(huì)上,通義大模型7連發(fā),在模型智能水平、Agent工具調(diào)用和Coding能力、深度推理、多模態(tài)等方面實(shí)現(xiàn)多項(xiàng)突破。
Qwen3-Max性能躋身全球前三
在大語(yǔ)言模型中,阿里通義旗艦?zāi)P蚎wen3-Max全新亮相,性能超過(guò)GPT5、Claude Opus 4等,躋身全球前三。Qwen3-Max包括指令(Instruct)和推理(Thinking)兩大版本,其預(yù)覽版已在 Chatbot Arena 排行榜上位列第三,正式版性能可望再度實(shí)現(xiàn)突破。
Qwen3-Max是通義千問(wèn)家族中最大、最強(qiáng)的基礎(chǔ)模型,預(yù)訓(xùn)練數(shù)據(jù)量達(dá)36T tokens,總參數(shù)超過(guò)萬(wàn)億,擁有極強(qiáng)的Coding編程能力和Agent工具調(diào)用能力。在大模型用Coding解決真實(shí)世界問(wèn)題的SWE-Bench Verified測(cè)試中,Instruct版本斬獲69.6分,位列全球第一梯隊(duì);在聚焦Agent工具調(diào)用能力的Tau2-Bench測(cè)試中,Qwen3-Max取得突破性的74.8分,超過(guò)Claude Opus4和DeepSeek-V3.1。
Qwen3-Next及系列模型正式發(fā)布
下一代基礎(chǔ)模型架構(gòu)Qwen3-Next及系列模型正式發(fā)布,模型總參數(shù)80B僅激活 3B ,性能即可媲美千問(wèn)3旗艦版235B模型,實(shí)現(xiàn)模型計(jì)算效率的重大突破。Qwen3-Next針對(duì)大模型在上下文長(zhǎng)度和總參數(shù)兩方面不斷擴(kuò)展(Scaling)的未來(lái)趨勢(shì)而設(shè)計(jì),創(chuàng)新改進(jìn)采用了混合注意力機(jī)制、高稀疏度 MoE 結(jié)構(gòu)、多 token 預(yù)測(cè)(MTP)機(jī)制等核心技術(shù),模型訓(xùn)練成本較密集模型Qwen3-32B大降超90%,長(zhǎng)文本推理吞吐量提升10倍以上,為未來(lái)大模型的訓(xùn)練和推理的效率設(shè)立了全新標(biāo)準(zhǔn)。
Qwen3-Coder重磅升級(jí)
在專項(xiàng)模型方面,千問(wèn)編程模型Qwen3-Coder重磅升級(jí)。新的Qwen3-Coder與Qwen Code、Claude Code系統(tǒng)聯(lián)合訓(xùn)練,應(yīng)用效果顯著提升,推理速度更快,代碼安全性也顯著提升。Qwen3-Coder此前就廣受開(kāi)發(fā)者和企業(yè)好評(píng),代碼生成和補(bǔ)全能力極強(qiáng),可一鍵完成完整項(xiàng)目的部署和問(wèn)題修復(fù),開(kāi)源后調(diào)用量曾在知名API調(diào)用平臺(tái)OpenRouter上激增1474%,位列全球第二。
視覺(jué)理解模型Qwen3-VL重磅開(kāi)源
在多模態(tài)模型中,千問(wèn)備受期待的視覺(jué)理解模型Qwen3-VL重磅開(kāi)源,在視覺(jué)感知和多模態(tài)推理方面實(shí)現(xiàn)重大突破,在32項(xiàng)核心能力測(cè)評(píng)中超過(guò)Gemini-2.5-Pro和GPT-5。
全模態(tài)模型Qwen3-Omni亮相
全模態(tài)模型Qwen3-Omni驚喜亮相,音視頻能力狂攬32項(xiàng)開(kāi)源最佳性能SOTA,可像人類一樣聽(tīng)說(shuō)寫(xiě),應(yīng)用場(chǎng)景廣泛,未來(lái)可部署于車載、智能眼鏡和手機(jī)等。用戶還可設(shè)定個(gè)性化角色、調(diào)整對(duì)話風(fēng)格,打造專屬的個(gè)人IP。
通義萬(wàn)相推出Wan2.5-preview系列模型
通義萬(wàn)相推出Wan2.5-preview系列模型,涵蓋文生視頻、圖生視頻、文生圖和圖像編輯四大模型。通義萬(wàn)相2.5視頻生成模型能生成和畫(huà)面匹配的人聲、音效和音樂(lè)BGM,首次實(shí)現(xiàn)音畫(huà)同步的視頻生成能力,進(jìn)一步降低電影級(jí)視頻創(chuàng)作的門檻。
通義萬(wàn)相2.5視頻生成時(shí)長(zhǎng)從5秒提升至10秒,支持24幀每秒的1080P高清視頻生成,并進(jìn)一步提升模型指令遵循能力。此次,通義萬(wàn)相2.5還全面升級(jí)了圖像生成能力,可生成中英文文字和圖表,支持圖像編輯功能,輸入一句話即可完成P圖。
語(yǔ)音大模型通義百聆正式發(fā)布
2025杭州云棲大會(huì)上,通義大模型家族還迎來(lái)了全新的成員——語(yǔ)音大模型通義百聆,包括語(yǔ)音識(shí)別大模型Fun-ASR、語(yǔ)音合成大模型Fun-CosyVoice。Fun-ASR基于數(shù)千萬(wàn)小時(shí)真實(shí)語(yǔ)音數(shù)據(jù)訓(xùn)練而成,具備強(qiáng)大的上下文理解能力與行業(yè)適應(yīng)性;Fun-CosyVoice可提供上百種預(yù)制音色,可以用于客服、銷售、直播電商、消費(fèi)電子、有聲書(shū)、兒童娛樂(lè)等場(chǎng)景。
模型日均調(diào)用量增長(zhǎng) 15倍阿里云百煉發(fā)布全新Agent框架
大會(huì)現(xiàn)場(chǎng),阿里云發(fā)布全新Agent開(kāi)發(fā)框架ModelStudio-ADK,該框架突破以預(yù)定義編排方式開(kāi)發(fā)Agent的局限,可幫助企業(yè)高效開(kāi)發(fā)具備自主決策、多輪反思和循環(huán)執(zhí)行能力的Agent。使用ModelStudio-ADK,1個(gè)小時(shí)就能輕松開(kāi)發(fā)一個(gè)能生成深度報(bào)告的Deep Research項(xiàng)目。隨著模型能力的不斷提升以及Agent應(yīng)用的爆發(fā),過(guò)去一年,阿里云百煉平臺(tái)的模型日均調(diào)用量增長(zhǎng)了15倍。
大會(huì)現(xiàn)場(chǎng),阿里云百煉還升級(jí)了低代碼Agent開(kāi)發(fā)平臺(tái)ModelStudio-ADP,該平臺(tái)已廣泛應(yīng)用于金融、教育和電商等領(lǐng)域企業(yè),目前,阿里云百煉平臺(tái)已有超20萬(wàn)開(kāi)發(fā)者開(kāi)發(fā)了80多萬(wàn)個(gè)Agent。
同時(shí),阿里云Agent Infra重要組件的無(wú)影AgentBay迎來(lái)重大升級(jí)。無(wú)影AgentBay是阿里云為Agent量身打造的“超級(jí)大腦” ,可動(dòng)態(tài)調(diào)用云上算力、存儲(chǔ)及工具鏈資源,大大突破了Agent在本地設(shè)備上的算力限制。
阿里云AI基礎(chǔ)設(shè)施全面升級(jí)
阿里云圍繞AI進(jìn)行了軟硬全棧的協(xié)同優(yōu)化和系統(tǒng)創(chuàng)新,已初步形成以通義為核心的操作系統(tǒng)和以AI云為核心的下一代計(jì)算機(jī)。過(guò)去一年,阿里云AI算力增長(zhǎng)超5倍,AI存力增長(zhǎng)4倍多。
2025年云棲大會(huì)現(xiàn)場(chǎng),全面升級(jí)的阿里云AI基礎(chǔ)設(shè)施重磅亮相,全面展示了阿里云從底層芯片、超節(jié)點(diǎn)服務(wù)器、高性能網(wǎng)絡(luò)、分布式存儲(chǔ)、智算集群到人工智能平臺(tái)、模型訓(xùn)練推理服務(wù)的全棧AI技術(shù)能力。
磐久128超節(jié)點(diǎn)AI服務(wù)器發(fā)布
在服務(wù)器層面,阿里云發(fā)布全新一代磐久128超節(jié)點(diǎn)AI服務(wù)器。新一代磐久超節(jié)點(diǎn)服務(wù)器由阿里云自主研發(fā)設(shè)計(jì),具備高密度、高性能和高可用的核心優(yōu)勢(shì),可高效支持多種AI芯片,單柜支持128個(gè)AI計(jì)算芯片,密度刷新業(yè)界紀(jì)錄。磐久超節(jié)點(diǎn)集成阿里自研CIPU 2.0芯片和EIC/MOC高性能網(wǎng)卡,采用開(kāi)放架構(gòu),擴(kuò)展能力極強(qiáng),可實(shí)現(xiàn)高達(dá)Pb/s級(jí)別Scale-Up帶寬和百ns極低延遲,相對(duì)于傳統(tǒng)架構(gòu),同等AI算力下推理性能還可提升50%。
新一代高性能網(wǎng)絡(luò)HPN 8.0全新亮相
在網(wǎng)絡(luò)層面,阿里云新一代高性能網(wǎng)絡(luò)HPN 8.0全新亮相。為應(yīng)對(duì)大模型時(shí)代對(duì)海量數(shù)據(jù)傳輸?shù)男枨?,HPN8.0采用訓(xùn)推一體化架構(gòu),存儲(chǔ)網(wǎng)絡(luò)帶寬拉升至800Gbps,GPU互聯(lián)網(wǎng)絡(luò)帶寬達(dá)到6.4Tbps,可支持單集群10萬(wàn)卡GPU高效互聯(lián),為萬(wàn)卡大集群提供高性能、確定性的云上基礎(chǔ)網(wǎng)絡(luò),助力AI訓(xùn)推提效。
分布式存儲(chǔ)面向AI需求全面升級(jí)
在存儲(chǔ)層面,阿里云分布式存儲(chǔ)面向AI需求全面升級(jí)。高性能并行文件存儲(chǔ)CPFS單客戶端吞吐提升至40GB/s, 可滿足AI訓(xùn)練對(duì)快速讀取數(shù)據(jù)的極致需求;表格存儲(chǔ)Tablestore為Agent提供高性能記憶庫(kù)和知識(shí)庫(kù);對(duì)象存儲(chǔ)OSS推出 Vector Bucket,為向量數(shù)據(jù)提供高性價(jià)比的海量存儲(chǔ),相比自建開(kāi)源向量數(shù)據(jù)庫(kù),成本驟降95%,結(jié)合OSS MetaQuery 語(yǔ)義檢索和內(nèi)容感知能力,可快速構(gòu)建RAG等AI應(yīng)用。
智能計(jì)算靈駿集群能力全面升級(jí)
在AI智算集群層面,智能計(jì)算靈駿集群通過(guò)多級(jí)親和性與拓?fù)涓兄{(diào)度設(shè)計(jì),基于HPN 網(wǎng)絡(luò)支持10萬(wàn)卡穩(wěn)定互聯(lián),多級(jí)可擴(kuò)展的架構(gòu)讓每張卡間互聯(lián)路徑更短、帶寬更優(yōu)。靈駿集群面向任務(wù)的穩(wěn)定性設(shè)計(jì)、故障分鐘級(jí)恢復(fù)能力,有效提高了模型訓(xùn)練任務(wù)的集群穩(wěn)定性。
第九代企業(yè)級(jí)實(shí)例升級(jí)
依托自研的“飛天+CIPU”架構(gòu)體系,阿里云第九代企業(yè)級(jí)實(shí)例采用英特爾、AMD的最新芯片,在大幅提升算力水平的同時(shí),可為Agent提供穩(wěn)定、安全、高性能的通用CPU算力。其中,九代AMD實(shí)例g9ae提供物理核的規(guī)格,性能最高提升67%,尤其適合企業(yè)離線數(shù)據(jù)分析處理、視頻轉(zhuǎn)碼等高并發(fā)場(chǎng)景。
容器服務(wù)ACK新增靈駿節(jié)點(diǎn)池
容器服務(wù)ACK新增靈駿節(jié)點(diǎn)池,引入模型感知智能路由、多角色推理負(fù)載管理、故障自愈等核心功能,自動(dòng)處理恢復(fù)時(shí)長(zhǎng)縮短了 85% ,模型推理冷啟動(dòng)提速10倍。容器計(jì)算服務(wù)ACS強(qiáng)化網(wǎng)絡(luò)拓?fù)涓兄{(diào)度,任務(wù)通信性能整體提升30%,并針對(duì)AI Agent場(chǎng)景深度優(yōu)化,Serverless GPU算?開(kāi)箱即用,支持每分鐘15000沙箱的大規(guī)模并發(fā)彈性,結(jié)合安全沙箱、智能休眠與喚醒,實(shí)現(xiàn)Agent隨需啟用、高效響應(yīng)。
人工智能平臺(tái)PAI與通義大模型聯(lián)合優(yōu)化
阿里云人工智能平臺(tái)PAI與通義大模型聯(lián)合優(yōu)化,印證了全棧AI的“1+1>2”的效果。在訓(xùn)練層,針對(duì)MoE模型,采用統(tǒng)一調(diào)度機(jī)制、自適應(yīng)計(jì)算通信掩蓋、EP計(jì)算負(fù)載均衡和計(jì)算顯存分離式并行等優(yōu)化手段,使得通義千問(wèn)模型訓(xùn)練端到端加速比提升3倍以上;升級(jí)DiT模型訓(xùn)練引擎,通義萬(wàn)相單樣本訓(xùn)練耗時(shí)降低28.1%;在推理層,通過(guò)大規(guī)模EP、PD/AF分離、權(quán)重優(yōu)化、LLM智能路由在內(nèi)的全鏈路優(yōu)化,實(shí)現(xiàn)推理效率顯著提升:推理吞吐TPS增加71%,時(shí)延TPOT降低70.6%,擴(kuò)容時(shí)長(zhǎng)降低97.6%。
來(lái)源:阿里云