日前,龍芯在官方微信發文稱,新一代四核處理器龍芯3A6000流片成功,龍芯3A6000處理器總體性能與Intel公司2020年上市的第10代酷睿四核處理器相當。
之后,有媒體對龍芯3A6000處理器提出質疑,比如未公布對標的英特爾處理器的相關數據,又比如使用SPEC CPU 2006,而非SPEC CPU 2017。另外,該文還對鐵流以往文章斷章取義,并以“截至發稿,該公司市值在400億左右,相較4月份市場炒作AI算力時,已經接近腰斬”作為文章開頭。言下之意已經非常明顯,那就對龍芯3A6000持懷疑態度,甚至是否定性評價。
鐵流認為,龍芯3A6000是一款具有里程碑意義的處理器,個別媒體在沒有實測數據的情況下胡亂猜疑,是非常值得商榷的。
龍芯3A6000與英特爾處理器實測數據對比
由于英特爾處理器市場占有率大,網上公開測試數據很多,鐵流搬運幾個英特爾10代酷睿處理器SEPC2006測試成績。SEPC測試12項定點程序和14項浮點程序,這26項程序都是很常規基礎的,比較有代表性,所以用來評定CPU性能。
測試的10代酷睿是i5-10400,測試用的操作系統是Fedora 38,編譯器是gcc 13.1.1,C庫是glibc 2.37。CPU自動睿頻,編譯器優化選項只開O2,測試成績(base):單線程整數46.1,單線程浮點46.1;8線程整數147,8線程浮點126。由于i5-10400是6核心12線程,這里的8線程分數是通過numactl綁定前8個線程測試出來。
從這個成績可以看出,同樣是base分值,i5-10400的整數性能比3A6000高3分,龍芯3A6000的浮點性能比i5-10400高8.5分,可以說單核性能各有千秋。在測試8線程的情況下,多線程性能則是龍芯更強。這里說明以下,I5-10400的編譯器是gcc 13.1.1,龍芯用的是gcc8.3,在編譯器上英特爾已經占便宜了。
由于10代I3和龍芯一樣是四核CPU,鐵流就用i3-10100F與3A6000作對比。
從數據對比中可以看出,龍芯3A6000比使用H510M主板,雙2666內存,原裝散熱的i3-10100F要略強,只有在加強散熱后,i3-10100F把主頻提到4Ghz以上,才能在性能上超過主頻為2.5Ghz的龍芯3A6000。
一般情況下,玩家會給I7、I9加強散熱,但I3這個級別的CPU往往用原裝散熱,龍芯在以往的PPT中稱3A6000處理器可以對標英特爾10代I3,這完完全全是大實話。
考慮到龍芯的GCC編譯器和X86處理器的GCC編譯器有差距,不少應用的動態指令數明顯比X86偏高,未來龍芯加強軟件建設,進一步優化GCC編譯器,3A6000處理器的測試成績還有一定提升空間。
我們再來看Steam測試,這項測試主要考驗訪存性能,下圖是i3-10100F的8線程成績。
上圖是龍芯的成績,從中可以看出,龍芯3A6000處理器在8線程數據帶寬上全面優于i3-10100F,事實上,龍芯3A6000處理器4線程的各項數據帶寬比i3-10100F 8線程高了10000MB/S以上。
龍芯3A6000處理器4線程數據帶寬比龍芯8線程的成績更高,主要是因為更多線程訪存通路沖突更厲害,導致局部性不好,下一代的3B6000只要增大緩存,訪存性能會有立竿見影的提升。
總的來說,龍芯3A6000處理器對標10代I3,或對標10代酷睿四核處理器已經是比較謙虛的措辭了,只不過很多媒體不自信,或者是潛意識中敵視自主技術,總是用有色眼鏡看待龍芯。
IPC追平12代酷睿 單核性能追平10代酷睿
在龍芯以往的宣傳中,由于在IPC和主頻上與英特爾都有差距,其中,IPC的差距相對小一些,因而龍芯往往用同主頻性能追平英特爾的某款處理器的方式進行宣傳。
比如龍芯3A3000是同主頻追平英特爾第一代酷睿,3A4000是同主頻追平AMD第一代銳龍......這種宣傳方式一方面是龍芯“揚長避短”,另一方面也是龍芯依靠設計能力提升CPU性能的最佳體現(主頻提升很大程度依靠制造工藝)。
不過,到了3A6000,由于同主頻性能這個長版實在是太卓越了——IPC達到了定點17/G,浮點22/G,這個成績已經追平英特爾12代酷睿。英特爾10代酷睿的IPC是見下表。
從測試來看,由于存在邊際效應,IPC會隨著主頻提升而下降,我們以2.5Ghz主頻下的IPC數據為準,這也是龍芯3A6000的主頻,方便對兩者進行比較。在2.5Ghz主頻下,i3-10100F的測試結果為定點12.4/G,浮點15.12/G。
由于在IPC上龍芯相對于10代酷睿有明顯優勢,導致2.5Ghz的3A6000性能上優于3.5Ghz的主頻的i3-10100F。即便是4Ghz主頻的i3-10100F比2.5Ghz主頻的龍芯3A6000也只是略占優勢,定點比龍芯高6.9%,浮點比龍芯高5.5%。考慮到英特爾在編譯器上占便宜,從裸CPU純硬件的角度看,可以認為2.5Ghz的3A6000與4Ghz的i3-10100F是同一檔次的CPU。
個別媒體對鐵流同主頻性能追平12代酷睿的說法斷章取義,并移花接木,認為龍芯3A6000只是同主頻追平10代酷睿,明顯是在混淆概念,強行貶低龍芯取得的進步。
媒體抨擊龍芯主頻只有英特爾一半,這其實有點找茬的嫌疑,事實上,英特爾大部分CPU的主頻基本在3Ghz至4+Ghz,5Ghz主頻CPU功耗會非常高,基本是要上液冷了,屬于發燒友的玩物,不具備普適性。誠然,14代酷睿普及之后,會有大量5Ghz主頻的處理器,但就市場存量而言,幾年內,3Ghz至4+Ghz依然是主流。
另外,使用SPEC CPU 2006這款測試軟件,而不是SPEC CPU 2017,也成為媒體質疑龍芯的攻擊點,鐵流認為,這純屬故意找茬了。
SPEC CPU 2017測試項目比SPEC CPU 2006要多,測試項目是增加了,也確實存在差異,兩者的成績沒有固定的換算比例,多任務測試和單任務測試的測試項目也有區別,單任務的 thread-1 和 多任務的 rate-1成績也不等同,但最終結果上基本大同小異,SPEC CPU 2006測試表現好的CPU,在SPEC CPU 2017表現也好,反之亦然。
用數據說話,從下表來看,SPEC CPU 2006測試較高的龍芯和海光,SPEC CPU 2017測試的成績也比較高。
之所以用龍芯3A5000來測試,是因為龍芯3A5000在電商平臺很容易買到,好買好測。而3A6000目前只在龍芯的合作伙伴手里有。
注意,龍芯3A5000是上一代CPU,在性能上只是略遜色于海光,3A6000相對于3A5000又提升60%,堪稱國產CPU的標桿。有鑒于龍芯可以在電商平臺以相對低廉的價格購買(3A5000,16G+512G,活動價2399元),再過幾個月,愛好者可以用SPEC CPU 2017實測3A6000。
龍芯3A6000是里程碑
從這幾年的實踐來看,比較成功的模式有兩種:
一種是龍芯模式,走自主路線,指令集、核心IP全部自主研發,一步一個腳印,購買境內成熟工藝,依靠自身的設計能力提升芯片性能;
另一種是引進ARM模式,走技術引進路線,購買ARM最強IP,購買臺積電尖端工藝設計手機SoC,通過融入國際產業鏈取得商業上的成功。
龍芯模式的優點是自主性高、省錢、鍛煉人、后勁足,不依賴國外IP和臺積電尖端工藝,缺點是前中期發展慢,商業推廣困難,軟件生態建設難。
引進ARM模式的優點是商業推廣容易,前期就能依靠技術引進達到國際一流水平,可以使用ARM成熟生態,缺點是對資金需求大,且設計上依賴ARM的IP,制造上依賴臺積電尖端工藝,當國際局勢風平浪靜的時候,引進ARM模式可以快速取得成功,但當國際局勢風云變幻之際,引進ARM模式風險巨大。
近年來,受貿易摩擦影響,國產ARM處理器在ARM授權和臺積電工藝兩個環節被卡脖子,直接導致“絕版”。媒體用“龍芯現場對比的ARM CPU,基本都是三四年前發布的產品”來質疑龍芯,事實是在被制裁后,這些ARM CPU/SOC在這幾年時間里沒有推出新CPU,某廠商已經在PPT上迭代了3代CPU,但根本拿不出實物芯片。這明明是ARM CPU無法自主迭代,但在媒體口中,反而成為抨擊龍芯的質疑點。
誠然,某ARM CPU廠商在2022年推出了基于境內14nm工藝打造的桌面CPU PG900,在脫離了臺積電尖端工藝后,CPU性能暴跌,雖然PG900和龍芯6000采用同等級制造工藝,但SPEC2006測試只有12+分,只有龍芯3A6000的27%,由于性能太低,不適合與龍芯3A6000同臺競技進行對比。
當下,國產CPU很難大批量的使用臺積電7nm以下工藝流片,這使國產CPU的工藝普遍被“鎖”在了12/14nm,在這種情況下,龍芯一貫以設計能力提升CPU性能的技術路線發揮出了威力,即便被美國列入實體清單,CPU依然有序迭代,而且性能突飛猛進。
龍芯3A6000既是自主技術打敗引進ARM的里程碑,也是在美國技術封鎖下,不斷自主創新的里程碑。也許正是龍芯的成績過于耀眼,特別是其另起爐灶,獨立自主的技術路線讓崇洋媚外之徒非常不爽,所以往往要承受最多的非議和攻擊。
結 語
就宣傳而言,龍芯早年的宣傳確實過于樂觀,但這幾年步入正軌后,宣傳反而越來越保守,最初3A6000的PPT成績是35-40分,結果現在實測是44分,而且官宣的測試成績基本能被愛好者復現,有的愛好者甚至測出比官宣更好的成績。
相比之下,某些引進CPU的宣傳則充滿了語言的藝術,比如某ARM CPU鼓吹“超出業界標桿25%”,但這個所謂“超出業界標桿25%”是用64核 VS 英特爾28核才取得的成績,在單核性能上與英特爾差距明顯。
至于一些人強調“單核不重要,多核才重要”的言論,這純屬外行,當年“I3默秒全”,就是因為AMD單核性能不行,AMD能依靠銳龍翻身,就是因為單核性能上來了。忽視單核性能的重要性,最終只會導致“1核有難,7核圍觀”。
不知為何,明明龍芯的官宣數據非常真實,甚至可以說是保守,留了不少余地。我們的媒體卻對自主技術非常苛刻,寧可捕風捉影,移花接木,也要在沒有實測數據的情況下貶低龍芯。
同時,這些人對引進CPU又非常寬容,哪怕其宣傳中有不少水分,充滿了語言的藝術,卻從來沒有像龍芯這樣被針對。
鐵流希望,部分媒體人和行業人士莫要膝蓋生根,哪怕萬般不情愿,也必須學會正視自主技術的進步。
相關文章
「 支持烏有之鄉!」
您的打賞將用于網站日常運行與維護。
幫助我們辦好網站,宣傳紅色文化!