近日,阿里云正式對(duì)外發(fā)布了全新處理器:CIPU,并宣稱CIPU未來(lái)或?qū)⑻娲鶦PU成為云計(jì)算的管控和加速中心。
CPU指中央處理器,它的規(guī)格決定了一臺(tái)服務(wù)器工作效能的高低,當(dāng)前的云計(jì)算基于以CPU為中心的體系架構(gòu),以軟件定義的方式進(jìn)行優(yōu)化,在數(shù)據(jù)量暴漲的情況下已然觸及瓶頸。
CIPU則是指云基礎(chǔ)設(shè)施處理器,它能通過(guò)特定的操作系統(tǒng),將阿里云再全球的200 多萬(wàn)臺(tái)服務(wù)器變成一臺(tái)“超級(jí)計(jì)算機(jī)”,為客戶提供更高性能、更低價(jià)格、更可靠的云計(jì)算服務(wù)。
一家小店的運(yùn)營(yíng)能力,再怎么提高也有限度,兩百萬(wàn)家小店高效協(xié)同之下,運(yùn)營(yíng)能力的提升可想而知。而從個(gè)體計(jì)算機(jī)的集群到“超級(jí)計(jì)算機(jī)”的誕生,也更符合云計(jì)算的定義。
可以說(shuō),CIPU從源頭再造了云計(jì)算全新發(fā)展路徑,這種回歸源頭突破瓶頸的方式,與整個(gè)現(xiàn)代科技的發(fā)展路徑不謀而合,正如基礎(chǔ)科學(xué)是土壤,應(yīng)用技術(shù)是樹木,當(dāng)參天大樹難以長(zhǎng)成的時(shí)候,最需要的往往是厚植培育土壤。
01
云計(jì)算遭遇什么瓶頸?
要想更深入地理解阿里云對(duì)以CIPU取代CPU成為云計(jì)算體系架構(gòu)中心的信心,還需要將之放入云計(jì)算發(fā)展歷程當(dāng)中來(lái)看。
在過(guò)去十多年里,云計(jì)算技術(shù)經(jīng)歷了兩個(gè)發(fā)展階段。第一個(gè)階段是分布式和虛擬化技術(shù)替代了大型機(jī)、小型機(jī),滿足了當(dāng)時(shí)企業(yè)業(yè)務(wù)擴(kuò)展帶來(lái)的算力彈性需求。
企業(yè)通過(guò)分布式架構(gòu)將計(jì)算能力打散到不同的機(jī)器上,解放供應(yīng)鏈的彈性,同時(shí)引入虛擬化技術(shù),實(shí)現(xiàn)分時(shí)復(fù)用,解決單個(gè)集群資源利用率相對(duì)較低的問(wèn)題。
這種分布式架構(gòu)讓企業(yè)具備了云的基礎(chǔ)技術(shù)能力,但沒(méi)有云計(jì)算的核心生產(chǎn)力,比如沒(méi)有達(dá)到即開即用的資源彈性、按需擴(kuò)容、線性可擴(kuò)展性等,難以滿足規(guī)模不斷擴(kuò)大的業(yè)務(wù)需求。
第二階段是資源池化技術(shù),把計(jì)算和存儲(chǔ)資源分離,再規(guī)?;幣藕驼{(diào)度,提供了超大規(guī)模的計(jì)算和存儲(chǔ)資源池。
這種通過(guò)將不同的物理資源變成虛擬化的資源,進(jìn)行統(tǒng)一池化管理的技術(shù),推動(dòng)了公有云時(shí)代的加速到來(lái),企業(yè)不再需要自己管理這些資源,而是由云廠商提供統(tǒng)一調(diào)度、統(tǒng)一管理和統(tǒng)一編排,以提高資源的利用率。
如果說(shuō)分布式和虛擬化技術(shù)成就了云計(jì)算的崛起,資源池化技術(shù)則是大大降低了云計(jì)算的使用門檻。但它們都是通過(guò)軟件定義的方法,基于傳統(tǒng)的以CPU為中心的體系架構(gòu)去做優(yōu)化,隨著數(shù)字經(jīng)濟(jì)的到來(lái),“以軟件定義為主”的云計(jì)算再次無(wú)法滿足產(chǎn)業(yè)需求。
云廠商們發(fā)現(xiàn)管理基礎(chǔ)設(shè)施規(guī)模越來(lái)越大,復(fù)雜度也越來(lái)越高,數(shù)據(jù)密集型的計(jì)算越來(lái)越多,一個(gè)純軟件定義的、以 CPU 為中心的云體系結(jié)構(gòu),虛擬化的代價(jià)很高,費(fèi)用會(huì)不斷增加,也難以實(shí)現(xiàn)對(duì)云計(jì)算低時(shí)延、高帶寬的需求。
行業(yè)期待著、也努力著推動(dòng)下一代云計(jì)算的發(fā)展。2020年之后,部分芯片巨頭陸續(xù)推出了相關(guān)數(shù)據(jù)中心產(chǎn)品,如英偉達(dá)的DPU(Data Processing Unit,數(shù)據(jù)處理器)和英特爾的IPU(Infrastructure Processing Units,基礎(chǔ)設(shè)施處理器),與阿里云推出CIPU一樣,都是希望設(shè)計(jì)一個(gè)新的管控中心,以替換掉CPU的管控職能。
02
CIPU的破局思路
那么,這些誕生之初就被賦予了替代CPU使命的產(chǎn)品,是如何解決以CPU為中心的云計(jì)算所面臨的瓶頸呢?
首先來(lái)看DPU。它誕生的背景是帶寬與計(jì)算性能的增速失調(diào),CPU的性能從5-10年前每年30%的增幅,到三年前大概只有每年不到3%的增幅。而網(wǎng)絡(luò)帶寬每年依舊還有35%左右的增長(zhǎng),這意味著,處理性能和帶寬增速的比例從原來(lái)的大概1:1,變成了現(xiàn)在的1:10左右。
因此,DPU側(cè)重的是數(shù)據(jù)遷移帶寬能力,作為集成加速平臺(tái),DPU能夠從CPU上卸載關(guān)鍵的網(wǎng)絡(luò)、存儲(chǔ)和安全任務(wù),降低CPU的開銷,直接效果是給 CPU“減負(fù)”。
再來(lái)看IPU。IPU緊隨DPU之后,作用也有所類似。IPU通過(guò)專用協(xié)議加速器來(lái)加速基礎(chǔ)設(shè)施功能,包括存儲(chǔ)虛擬化、網(wǎng)絡(luò)虛擬化和安全,通過(guò)把軟件中的存儲(chǔ)和網(wǎng)絡(luò)虛擬化功能從CPU轉(zhuǎn)移到IPU,從而釋放CPU核心,還能允許靈活的工作負(fù)載分配,提高數(shù)據(jù)中心利用率。
因此,IPU更強(qiáng)調(diào)虛擬化云化能力,它擴(kuò)展了英特爾的智能網(wǎng)卡功能,旨在應(yīng)對(duì)當(dāng)下日益復(fù)雜的數(shù)據(jù)中心,提高數(shù)據(jù)密集場(chǎng)景的計(jì)算能力。
盡管技術(shù)路徑上有所區(qū)分,但無(wú)論是DPU還是IPU,都是想通過(guò)軟件定義+硬件加速的方式,替代CPU成為數(shù)據(jù)中心的核心硬件。
CIPU則更像是兩者的綜合體,它向下接入物理的計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)資源,快速云化并進(jìn)行硬件加速;向上接入飛天云操作系統(tǒng),管控阿里云全球上百萬(wàn)臺(tái)服務(wù)器,讓算力虛擬化損耗降到0,并通過(guò)規(guī)?;瘧?yīng)用RDMA網(wǎng)絡(luò)技術(shù),讓訪問(wèn)云端比訪問(wèn)本地硬盤更快。
因此,CIPU既能解決數(shù)據(jù)遷移帶寬的問(wèn)題,也能云化虛擬化管控?cái)?shù)據(jù)中心。同時(shí),搭載飛天系統(tǒng)設(shè)計(jì)后,實(shí)現(xiàn)了軟硬件一體化,既能通過(guò)硬件提供高性能,又能通過(guò)軟件提供靈活性。
而CIPU和飛天云操作系統(tǒng)還出自阿里云同一大的研發(fā)團(tuán)隊(duì)之手。阿里云基礎(chǔ)產(chǎn)品首席架構(gòu)師黃瑞瑞就曾在媒體采訪中指出:“向上設(shè)計(jì)的飛天云操作系統(tǒng)和向下的 CIPU,兩者之間結(jié)合的效果一定是大于 2 的,因?yàn)楸旧砭褪且惑w化的?!?/span>
03
3.0的云計(jì)算新生態(tài)
寶劍鋒從磨礪出,在正式推出CIPU和飛天云操作系統(tǒng)之前,阿里云在技術(shù)積累這條道路上已經(jīng)走了十余年。
2009年,阿里云自主研發(fā)云計(jì)算操作系統(tǒng)飛天誕生,這個(gè)系統(tǒng)幫助多個(gè)平臺(tái)解決了必不可少的極限并發(fā)場(chǎng)景,如天貓的雙十一購(gòu)物節(jié),12306的春運(yùn)購(gòu)票高峰等等。
2017年,阿里云再度自研發(fā)神龍架構(gòu),通過(guò)把虛擬化轉(zhuǎn)移到專用硬件中進(jìn)行加速,實(shí)現(xiàn)了性能“0損耗”,一定程度上解決了服務(wù)器虛擬化性能損耗的問(wèn)題。
此后,經(jīng)過(guò)數(shù)輪迭代,神龍卡逐漸加入了編排調(diào)度、硬件加速等更多能力,最終誕生了CIPU的雛形,并在不斷完善后推出。
不難發(fā)現(xiàn),阿里云先是通過(guò)對(duì)飛天系統(tǒng)的定義和迭代,實(shí)現(xiàn)了對(duì)于客戶需求清晰化的感知。然后才去做 CIPU,通過(guò)深度定制底層基礎(chǔ)設(shè)施,實(shí)現(xiàn)了客戶對(duì)于云計(jì)算的極致性能和體驗(yàn)。
與此同時(shí),CIPU和飛天系統(tǒng)還可以與其他自研產(chǎn)品,如神龍計(jì)算平臺(tái)、盤古存儲(chǔ)平臺(tái)和洛神網(wǎng)絡(luò)平臺(tái)等進(jìn)行深度的適配。實(shí)際上,阿里云已經(jīng)打造了以飛天云操作系統(tǒng)為核心,自研芯片、服務(wù)器、計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、安全等軟硬一體的新型計(jì)算體系架構(gòu)。
新型科技產(chǎn)業(yè)中,技術(shù)和產(chǎn)品的突破意味著生產(chǎn)力的變革和競(jìng)爭(zhēng)格局的重塑,因此,技術(shù)路線之爭(zhēng)或許還是企業(yè)乃至產(chǎn)業(yè)的命運(yùn)之爭(zhēng)。
一如新能源技術(shù),磷酸鐵鋰電池之爭(zhēng)與三元鋰電池之爭(zhēng),單晶硅片與多晶硅片之爭(zhēng)等等,背后都是一個(gè)個(gè)企業(yè)的沒(méi)落與崛起。又如移動(dòng)通信技術(shù),國(guó)內(nèi)產(chǎn)業(yè)從1G的空白、2G的跟隨、3G的同步,實(shí)現(xiàn)了5G的超越。
云計(jì)算也是如此。CIPU和飛天系統(tǒng)的推出意味著阿里云找到了一條打破云計(jì)算傳統(tǒng)發(fā)展路線的全新途徑,一旦成為主流,阿里云將擁有定義下一代云計(jì)算標(biāo)準(zhǔn)的實(shí)力,成為中國(guó)在云計(jì)算,乃至IT產(chǎn)業(yè)的國(guó)際競(jìng)爭(zhēng)中的一大助力。
正如鄭緯民院士所言,阿里云的CIPU將使得中國(guó)在爭(zhēng)取云計(jì)算的定義權(quán)中處于有利位置,改變了原本由西方技術(shù)制定的游戲規(guī)則,讓我國(guó)IT產(chǎn)業(yè)建立了全球領(lǐng)導(dǎo)力。這一改變格局的事,讓他對(duì)中國(guó)在下一個(gè)技術(shù)時(shí)代擁有自己的一席之地表示樂(lè)觀。
當(dāng)然,技術(shù)的發(fā)展往往是一個(gè)不斷突破、不斷前進(jìn)的過(guò)程,技術(shù)的路線之爭(zhēng)也常常是一個(gè)艱難且漫長(zhǎng)的過(guò)程,CIPU和飛天系統(tǒng)不會(huì)是云計(jì)算競(jìng)爭(zhēng)的終點(diǎn),阿里云仍需要不斷研發(fā)更多高附加值且代表產(chǎn)業(yè)發(fā)展方向的產(chǎn)品,以爭(zhēng)奪云計(jì)算的話語(yǔ)權(quán)。