HDI小編介紹下,下面這個大卡車就是阿里2017在杭州的云棲大會發(fā)布的專有云。這個卡車號稱最大能力可以處理500萬TPS業(yè)務(wù)。
阿里云副總裁李津在現(xiàn)場演示了阿里云專有云斷電,我們從技術(shù)上角度來看看實(shí)現(xiàn)這個有多復(fù)雜(阿里沒有公布具體的實(shí)現(xiàn),只能根據(jù)作者從業(yè)經(jīng)驗(yàn)推斷分析)。
講技術(shù)前,扯點(diǎn)其他的:
首先我覺得這個創(chuàng)意挺不錯,雖然有點(diǎn)類似AWS/Google。AWS 在2016 re:invent 就開了一輛卡車到大會主席臺,主要是可以幫助客戶一次性搬遷EB數(shù)據(jù),相當(dāng)于整個數(shù)據(jù)中心。阿里不完全一樣,是個私有云的概念。類似的數(shù)據(jù)中心集裝箱Google很早也提過。但是現(xiàn)場演示斷電還是首創(chuàng),從參會的媒體的報道來看,還是引起了很多話題。
另外,從中可以看出,阿里已經(jīng)決心進(jìn)入私有云和專有云,去拓展大型客戶。以前阿里上客戶的互聯(lián)網(wǎng)、創(chuàng)新業(yè)務(wù)比較多。阿里積累到一定程度之后,進(jìn)入中大型客戶,賺取更高額的利潤的決心變大。要做到這一點(diǎn),當(dāng)能需要滿足中大型客戶的訴求,可掌控,夠安全,夠穩(wěn)定。
下面回到這次演練來,演練選取一個模擬的比較簡單的業(yè)務(wù),記錄跑步者的各項(xiàng)數(shù)據(jù)(心跳,速度等等),排名顯示在大屏幕上,一共涉及四個服務(wù)SLB、RDS、ECS、OSS,演示的內(nèi)容就是斷掉其中的一個柜服務(wù)器(從演示來看,一共是6個柜,每個柜8臺服務(wù))業(yè)務(wù)不受影響,來體現(xiàn)災(zāi)備能力。
實(shí)事求是的說,做一個可靠的專有云還是有不少工作要做的,從硬件到軟件都要考慮相應(yīng)的冗余災(zāi)備設(shè)計。比如服務(wù)器本身要雙電源,網(wǎng)絡(luò)要冗余,上層基礎(chǔ)軟件要能自動切換,相關(guān)告警檢測能力都需要有。
不過這次演示的業(yè)務(wù)比較簡單,直接斷掉一框服務(wù),考驗(yàn)的主要是服務(wù)的業(yè)務(wù)切換能力。涉及的幾個服務(wù)SLB、RDS、OSS本身都是有分布式能力,ECS上裝應(yīng)用,應(yīng)用也比較簡單,主要就是個顯示展現(xiàn),可以直接無狀態(tài)分布。
SLB:負(fù)載均衡,負(fù)責(zé)將業(yè)務(wù)分發(fā)到有處理的能力的服務(wù)器;本身一般是主備容災(zāi)。
RDS:通過多實(shí)例分布式部署,數(shù)據(jù)庫自動同步能力。每個跑步者的數(shù)據(jù)是相互獨(dú)立的,一個實(shí)例掛了之后,其他實(shí)例接管業(yè)務(wù)。
OSS:對象存儲本身都是分布式多份冗余。
ECS:應(yīng)用無狀態(tài)分布,數(shù)據(jù)都存在RDS里面。跑步者的數(shù)據(jù)出錯,進(jìn)行重傳和重連即可。
總的來說,業(yè)務(wù)很簡單,演示的技術(shù)也都是成熟技術(shù)。