9月19日,在華為全連接大會(huì)2025主題演講環(huán)節(jié),華為常務(wù)董事、華為云計(jì)算CEO張平安圍繞“全面智能化,成就行業(yè)AI先鋒”,分享了華為云在AI云服務(wù)、大模型、具身智能、AI Agent等領(lǐng)域的技術(shù)創(chuàng)新與落地實(shí)踐。華為高級(jí)副總裁、華為云全球Marketing與銷售服務(wù)總裁楊友桂分享了數(shù)智化時(shí)代下,華為云幫助企業(yè)實(shí)現(xiàn)全球業(yè)務(wù)成功的創(chuàng)新技術(shù)和經(jīng)驗(yàn)思考。
超節(jié)點(diǎn)可實(shí)現(xiàn)百萬(wàn)卡超大集群
華為云CloudMatrix384昇騰AI云服務(wù)已全面上線。未來(lái)華為CloudMatrix超節(jié)點(diǎn)規(guī)格將從384卡升級(jí)到8192卡,可實(shí)現(xiàn)50-100萬(wàn)卡的超大集群。華為云首創(chuàng)EMS彈性內(nèi)存存儲(chǔ)服務(wù),用內(nèi)存擴(kuò)展顯存,顯著降低大模型多輪對(duì)話時(shí)延,大幅提升模型使用體驗(yàn)。
隨著AI算力需求的暴增,傳統(tǒng)的數(shù)據(jù)中心已不適合構(gòu)建高效的AI基礎(chǔ)設(shè)施,單機(jī)柜功率要從10千瓦/每柜,升級(jí)到70千瓦/每柜,甚至是200千瓦/每柜,要從風(fēng)冷轉(zhuǎn)變到全液冷。華為云在貴州、內(nèi)蒙古、安徽部署了全液冷AI數(shù)據(jù)中心,實(shí)現(xiàn)單機(jī)柜80千瓦散熱,PUE低至1.1,并能夠?qū)崿F(xiàn)AI智能運(yùn)維。企業(yè)無(wú)需改造或新建傳統(tǒng)數(shù)據(jù)中心,通過(guò)一對(duì)光纖,就能獲取華為云上高效的AI算力,也可以獲得全棧專屬AI云服務(wù)。
張平安指出,Token服務(wù)可以有效屏蔽復(fù)雜的底層技術(shù),直接為用戶提供最終的AI計(jì)算結(jié)果,是最高效的推理算力使用方式。CloudMatrix384超節(jié)點(diǎn)將算力、內(nèi)存、顯存等資源全面池化,把計(jì)算型任務(wù)、存儲(chǔ)型任務(wù)、AI專家系統(tǒng)解耦,將串行任務(wù)變成分布式并行任務(wù),極大地提升了系統(tǒng)的推理性能。在在線、近線和離線等不同時(shí)延推理場(chǎng)景中,CloudMatrix384平均單卡的推理性能達(dá)到H20的3到4倍。
會(huì)上,張平安宣布,CloudMatrix384 AI Token推理服務(wù)全面上線,以優(yōu)的性能、好的服務(wù)、高的質(zhì)量服務(wù)好客戶。
截止目前,使用華為云AI云服務(wù)的全球客戶數(shù)量從去年的321家增長(zhǎng)到今年的1805家。如360納米AI依托CloudMatrix384的Token推理服務(wù),成功處理每天上千萬(wàn)的內(nèi)容生成請(qǐng)求。Cloudmatrix384昇騰AI云服務(wù)支撐“磐石·科學(xué)基礎(chǔ)大模型”,將賦能中國(guó)科學(xué)院100多個(gè)院所的科研場(chǎng)景,不斷拓展人類認(rèn)知的前沿。
