“在阿里云粵港澳大灣區(qū)云峰會(huì)上,,阿里云智能云原生應(yīng)用平臺總經(jīng)理丁宇宣布,Serverless 容器服務(wù) ASK全面升級,,進(jìn)一步幫助企業(yè)和開發(fā)者降本提效,。”
6 月 1 日在阿里云粵港澳大灣區(qū)云峰會(huì)上,阿里云智能云原生應(yīng)用平臺總經(jīng)理丁宇宣布,,Serverless 容器服務(wù) ASK全面升級,,進(jìn)一步幫助企業(yè)和開發(fā)者降本提效。
Gartner 曾預(yù)測,,2023 年 70% 的 AI 應(yīng)用將基于容器和 Serverless 技術(shù)開發(fā),。作為云原生的重要技術(shù)組成,K8s 已經(jīng)被開發(fā)者和企業(yè)廣泛認(rèn)可,,然而其自身復(fù)雜性和陡峭的學(xué)習(xí)曲線依然讓人望而生畏,。
阿里云在 2018 年發(fā)布了首個(gè)Serverless容器服務(wù)ASK,其本質(zhì)是將容器的運(yùn)行時(shí)和具體的節(jié)點(diǎn)運(yùn)行環(huán)境解耦,,讓用戶無需管理K8s節(jié)點(diǎn)和服務(wù)器,,即可直接部署應(yīng)用,大幅降低容器服務(wù)的使用門檻,。目前,,ASK在容器化應(yīng)用、在線業(yè)務(wù)彈性,、AI/大數(shù)據(jù)計(jì)算類任務(wù)等場景中被廣泛使用,。
此次 ASK 的全新升級,進(jìn)一步整合了阿里云基礎(chǔ)設(shè)施的能力,,在使用成本,、創(chuàng)建效率、異構(gòu)資源兼容,、彈性供給保障等方面帶來顯著提升,,解決開發(fā)者在使用K8s的復(fù)雜性挑戰(zhàn),,也順應(yīng)了 AI場景爆發(fā)下催生的新需求。
丁宇介紹,,本次ASK升級涵蓋了多個(gè)維度,,包括對組件的全托管支持、AI鏡像的秒級拉取能力,,還降低了客戶的使用成本,。具體來說:
1、組件全托管,,零K8s運(yùn)維成本
ASK新增對 CoreDNS,、Metrics Server 等十多個(gè) K8s 核心組件的托管支持,提供動(dòng)態(tài)容量規(guī)劃能力,,客戶無需自行部署維護(hù),,最大化降低運(yùn)維復(fù)雜度。同時(shí),,ASK也新增了智能化風(fēng)險(xiǎn)識別能力,,支持自動(dòng)化升級K8s版本,避免升級導(dǎo)致的應(yīng)用故障或異常風(fēng)險(xiǎn),。
2,、極致彈性,準(zhǔn)確率提升80%
ASK 提供首界首創(chuàng)基于容器鏡像緩存的 AI 大鏡像秒級拉取能力,,AI 應(yīng)用啟動(dòng)時(shí)間降低90%,。并且提供端到端的彈性加速,面向AI/大數(shù)據(jù)工作負(fù)載容器化進(jìn)行全棧優(yōu)化,,通過數(shù)據(jù)集加速提升 30% 訪問性能,;此外,本次 ASK 還增強(qiáng)了智能彈性預(yù)測 AHPA能力,,相比人工配置,,彈性準(zhǔn)確率提升 80%;同時(shí)新增對于 GPU 的支持,。
3、普惠算力,,性價(jià)比提升40%
為了給客戶提供更好的服務(wù),,釋放技術(shù)紅利,讓算力更普惠,,ASK新增U實(shí)例規(guī)格支持,,統(tǒng)一支持多款處理器,相比上一代主售實(shí)例降價(jià)高達(dá)40%,。新增SavingPlan彈性版本,,面向應(yīng)用非固定波峰波谷場景,,額外成本優(yōu)化10%以上。為進(jìn)一步讓價(jià)格更透明,,新增成本套件支持,,清晰洞察彈性資源成本,讓成本治理更便捷,。
以數(shù)禾科技為例,,這是一家為金融機(jī)構(gòu)提供高效的智能零售金融解決方案的公司,對于模型的計(jì)算能力包括計(jì)算速度,、計(jì)算結(jié)果準(zhǔn)確性,、計(jì)算數(shù)據(jù)實(shí)時(shí)性等,有很高的要求,。而當(dāng)前的困擾是支撐模型計(jì)算的底層應(yīng)用資源無法根據(jù)請求量來調(diào)整機(jī)器資源支持運(yùn)算能力,,這也是當(dāng)前業(yè)務(wù)快速發(fā)展過程中亟待解決的痛點(diǎn)。同時(shí),,隨著模型在線推理服務(wù)數(shù)量的增加,,數(shù)禾的模型服務(wù)也變得越來越龐大、臃腫,,難以管理,。這種狀況不僅導(dǎo)致了資源浪費(fèi),還增加了維護(hù)和升級的成本,。
為了解決這些“頑疾”,,數(shù)禾科技采用阿里云 ASK 部署線上模型,無需 K8s 節(jié)點(diǎn)管理,,根據(jù)實(shí)時(shí)流量動(dòng)態(tài)使用 POD,,資源成本節(jié)省60%;通過 ASK Knative 服務(wù),,解決了數(shù)禾模型的灰度發(fā)布和多版本并存問題,;得益于ASK 自動(dòng)伸縮和縮容到 0 的優(yōu)勢,降低運(yùn)行成本,,大幅提升服務(wù)可用性,。
“使用阿里云容器服務(wù) Knative 和 ECI 虛擬節(jié)點(diǎn)配合部署,保證線上模型應(yīng)對突發(fā)流量的穩(wěn)定性提升的同時(shí),,又使資源利用效率顯著提高,,極大地節(jié)約了資源成本?!睌?shù)禾科技 AI 實(shí)驗(yàn)室 AI 平臺負(fù)責(zé)人周偉鵬表示,。
目前,ASK 已加入阿里云飛天免費(fèi)試用計(jì)劃,,為開發(fā)者,、企業(yè)提供一定額度的免費(fèi)試用資源,。3分鐘就可以創(chuàng)建Kubernetes集群,開啟容器彈性之旅,。