科技瞭望臺:Arm v9會帶來什么改變
在2011年,Arm發(fā)布了新一代Arm V8架構(gòu),在幾年后的蘋果iPhone 5S上,蘋果基于Arm v8架構(gòu)所打造的A7 SOC憑借一系列的新特性還有全新的64位應(yīng)用支持,在手機(jī)市場上取得了獨(dú)特的優(yōu)勢,大殺四方。而在十年后的2021年,ARM 推出了全新一代的Arm V9架構(gòu),全新的Arm V9將會帶來什么新特性的加入,對于ARM來說還會帶來什么改變?本期科技瞭望臺就讓我們一起遠(yuǎn)望Arm V9所帶來的改變。
01/Arm V9有何不同?
本次Arm 推出的Arm V9目標(biāo)重點(diǎn)在三個(gè)部分:第一個(gè)是安全性方面的提升、第二個(gè)是更進(jìn)一步的AI性能、第三個(gè)是整體性能速度的提升。
我們先來看第一個(gè)方面,在安全性部分上,Arm V9加入了包括內(nèi)存標(biāo)簽(memory tagging)和域管理(Realm management) 在內(nèi)的關(guān)鍵內(nèi)容,進(jìn)一步提供了內(nèi)存方面的安全性,并且在有關(guān)安全性方面的數(shù)存放上,創(chuàng)建了更進(jìn)一步的保險(xiǎn)容器機(jī)制。除此之外,全都的Arm V9還引入了新的Arm保密計(jì)算架構(gòu)(CCA),這一個(gè)Arm保密計(jì)算架構(gòu)(CCA)通過基于硬件的安全環(huán)境保護(hù)敏感數(shù)據(jù)。可動態(tài)創(chuàng)建各種需要調(diào)用的域,在域中可對所得的代碼進(jìn)行使用,其余的內(nèi)容無法被使用調(diào)配,以保護(hù)重要數(shù)據(jù)和代碼不受影響。
而在AI性能和整體速度的提升上,Arm認(rèn)為在未來幾年中越來越多的ML工作負(fù)載(機(jī)器學(xué)習(xí)負(fù)載)將變得司空見慣。更多的AI會在各種領(lǐng)域進(jìn)行更進(jìn)一步的應(yīng)用,而在AI性能提升的同時(shí),也需要配備更進(jìn)一步的性能。由此引入了全新的升級。
在Arm V9上,Arm引入了SVE2指令集(SVE 可伸縮向量擴(kuò)展),SVE2指令集相比SVE的128位矢量,SVE2可以支持多倍128位運(yùn)算,最多2048位,因此SVE2可以增強(qiáng)ML機(jī)器學(xué)習(xí)、DSP信號處理能力,提升了未來5G、虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)以及CPU本地運(yùn)行ML的性能。通過SVE2指令集的加入,Arm V9能支持更進(jìn)一步的矩陣卷積算法,且將SVE2指令集的部分性發(fā)揮在AI上,使得Arm V9在AI性能和其他應(yīng)用上取得更好的表現(xiàn)。
Arm V9整體比起Arm V8來說,并沒有從Arm V7向Arm V8之間的升級那么明顯,雖然有諸如領(lǐng)域管理拓展、內(nèi)存拓展等一系列的功能,但在其中最為大的差距就是全新的SVE2指令集的加入。所以外媒認(rèn)為此次從V8升級到V9的ISA(指令集架構(gòu) Instruction Set Architecture),SVE2指令集是一個(gè)關(guān)鍵。
02/跟隨Arm V9推出的硬件
在Arm V9推出的同時(shí),采用Arm V9指令集架構(gòu)的硬件也被同步推出。ARM 推出了Cortex X2、Cortex A710以及Cortex A510這三個(gè)公版的全新核心。
我們先看Arm推出的Cortex X2核心,這一個(gè)核心延續(xù)了Cortex X1目前的大核定位。在官方的PPT對比上,Cortex X2相比較于Arm自家推出的Cortex X1有了接近16%的IPC提升。但是如果我們仔細(xì)看可以發(fā)現(xiàn),在AERM官方的對比上是8MB L3(三級緩存) 的Cortex X2去對比4MB L3的Cortex X1而得到的16% IPC提升,所以在實(shí)際的提升方面并不會高出很多。而在功耗方面,Arm官方展示在同一個(gè)工藝節(jié)點(diǎn)的情況下,Cortex X2核心所需的更好將比Cortex X1核心高出22%,在這種情況下,若如不對制程工藝進(jìn)行升級,以現(xiàn)階段的工藝對Cortex X2核心進(jìn)行制造生產(chǎn),必然又是功耗增大而導(dǎo)致一系列的翻車問題,對于不少的廠家來說有如噩夢一般。
然后是Arm推出的Cortex A710核心,在Cortex X系列核心推出前,Cortex A7XX系列是Arm系列中的大核心,在Cortex X推出后,Cortex A7XX系列核心在目前就是被定為中核的規(guī)格。
Cortex A710核心整體和此前推出的Cortex A78核心相比較,更像是一個(gè)全新的補(bǔ)丁修正提升版本。Cortex A710核心重點(diǎn)是對于分支預(yù)測計(jì)算性能的提升還有在分支預(yù)測緩存方面的緩存提升。并且Arm官方也宣稱Cortex A710核心擁有更進(jìn)一步的能耗比提升。
而從Arm官方的對比來看,Cortex A710(8MB L3)相比較Cortex A78(4MB L3)提升了接近10%的整體性能,在達(dá)到同樣性能的情況下,功耗降低了30%。但是如果我們考慮到對比中的差異的話,那么實(shí)際的產(chǎn)品還有怎么樣的表現(xiàn),就需要打一個(gè)問號了。
最后是Arm推出的Cortex A510核心,在官方的定位中,其屬于小核的分類中。在Cortex A510上,出現(xiàn)了有所不同的地方,Cortex A510采用的是兩顆核心為一組的設(shè)計(jì),兩兩一組之間共享L2緩存以及浮點(diǎn)性能。SVE2之類的支持等特性,這一點(diǎn)類似于AMD早年推出的推土機(jī)架構(gòu),也是采用了兩兩一組的共享L2之類的設(shè)計(jì)。而至于會帶來什么樣實(shí)際的提升和一系列的有關(guān)內(nèi)容,還需要等待全新產(chǎn)品的出現(xiàn)。
除了CPU核心之外,Arm還對旗下的Mali系列GPU進(jìn)行了更新,推出了G710、G610、G510、G310。其中的G710是G78后的直接繼任者,定位于旗下的高端旗艦。而G610是定位比G710低一檔的產(chǎn)品,是定位于高端的產(chǎn)品。G510則是接任G57定位于中端產(chǎn)品。G310是接替G31的入門級產(chǎn)品,將主要面向智能電視以及部分的場景需求。
03/展望未來
在現(xiàn)階段,接入谷歌Play生態(tài)的APP已經(jīng)是全部轉(zhuǎn)為64位應(yīng)用。但是在國內(nèi),由于各大應(yīng)用數(shù)量的眾多且分發(fā)平臺較為分散,所以在現(xiàn)階段還是存在不少的32位APP。Arm此次基于Arm V9推出的Cortex X2、Cortex A710以及Cortex A510中,Cortex X2以及Cortex A510只有對于AArch64的支持,也就是說只對64位應(yīng)用進(jìn)行支持。而根據(jù)Arm官方的說法的,為了部分地區(qū)的需求Cortex A710并非只對AArch64進(jìn)行支持,而是對AArch32也進(jìn)行了支持,也就是說其中的Cortex A710還能實(shí)現(xiàn)對32位應(yīng)用的兼容。從Arm 一系列規(guī)范來看,國內(nèi)的應(yīng)用更要進(jìn)一步的加速升級至64位應(yīng)用,才能對核心性能進(jìn)行更好的利用,而不是只是將性能負(fù)載放置在Cortex A710上。
Arm官方也宣布了對于未來的的展望,Arm預(yù)測未來十年合作伙伴基于ARM芯片的出貨量將超過3000億。Arm正致力于將Arm v9技術(shù)引入各個(gè)領(lǐng)域,以系統(tǒng)級設(shè)計(jì)最大程度地提高性能。借助移動生態(tài)系統(tǒng)的規(guī)模優(yōu)勢,在筆記本電腦、臺式機(jī)、云等應(yīng)用領(lǐng)域打造領(lǐng)先的解決方案。” Arm v9 還希望延伸到5G網(wǎng)絡(luò)、數(shù)據(jù)中心、以及更多終端與車載架構(gòu)計(jì)算。
對于國內(nèi)的廠家來說,Arm 官方宣布,經(jīng)過了一系列的技術(shù)審查,Arm v9架構(gòu)不受美國出口管理?xiàng)l例(EAR)的約束。所以對于受到美國打壓的企業(yè)來說,依然可以購買到Arm V9的授權(quán),在這一個(gè)IP上進(jìn)行一系列的后續(xù)開發(fā)。
此次Arm推出的產(chǎn)品還是屬于初級階段,后續(xù)Arm應(yīng)該會對處理器和GPU之類的內(nèi)容進(jìn)行進(jìn)一步的更新,以發(fā)揮更進(jìn)一步的性能。
關(guān)注我們


