近年來,人工智能火遍大江南北,全國各地也開始建設(shè)人工智能中心,眾多媒體也爭相報道吹捧。也許是媒體不懂技術(shù),胡亂拿AI集群和超算做比較,在新聞報道中鬧了不少烏龍,一些報道堪比造謠,甚至一些官媒也出現(xiàn)了錯誤報道。事實上,AI集群是劍走偏鋒的產(chǎn)物,重視的是半精度浮點運算以及更低精度的整型計算,而超算則是雙精度浮點運算,雖然都在媒體報道中都用235P、1000P算力來表示,但兩者完全不是一回事。媒體在報道中拿用AI集群的半精度浮點運算算力去對比超算的雙精度浮點運算算力,完全就是關(guān)公戰(zhàn)秦瓊,客觀上是在變相貶低超算。
關(guān)公戰(zhàn)秦瓊屢見不鮮
今年3月,地方官媒報道武漢人工智能計算中心項目,對該人工智能中心贊美之詞溢于言表。
文章中提到:
據(jù)介紹,建成后,采用了華為Atlas900AI集群的該中心其AI(人工智能)峰值性能可達100PFLOPS(每秒百億億次浮點計算),另外,HPC(高性能計算)峰值性能可達4PFLOPS(每秒四千萬億次浮點運算)。據(jù)了解,“FLOPS”參數(shù),中文又叫“每秒浮點運算次數(shù)”,是衡量算力的很重要指標。
怎么理解武漢人工智能計算中心百P級算力規(guī)模及水平呢?舉個例子,我國在2009年成功研發(fā)“天河一號”超級計算機,每秒可進行1200萬億次的計算,而如今武漢中心能達百億億次,中間提升跨越了兩個檔位。以天文探索為例,在20萬顆星星的星空圖中定位某種特征的星體,一個天文學家需要耗費169天,而擁有此算力,定位時間縮短為10秒。未來,工廠里機器協(xié)同、醫(yī)院里電子閱片的反應(yīng)速度都將大幅提升。
對于該報道,一位專家指出,“其實武漢這臺機器的64位浮點計算能力與天河一號接近,甚至低一點。只是低精度性能比較高。千萬不要搞錯了!!!”
可見,媒體報道中所謂的“我國在2009年成功研發(fā)天河一號超級計算機,每秒可進行1200萬億次的計算,而如今武漢中心能達百億億次,中間提升跨越了兩個檔位”是不客觀的。64位浮點計算能力更強的天河超算在媒體筆下平白無故被貶低,并以“1200萬億次”和“百億億次”的數(shù)據(jù)差距來顯示AI集群吊打天河一號,這可能是天河超算被黑的最慘的一次。
2019年,一篇報道中稱:
對包括《XXX新聞》記者在內(nèi)的媒體透露:“鵬城云腦Ⅱ原型系統(tǒng)現(xiàn)已實現(xiàn)100PFLOPS(每秒百億億次計算)的算力。明年,鵬城云腦Ⅱ?qū)⑦_到1000PFLOPS,成為領(lǐng)先的AI研究平臺。”而當今世界上最強的超級計算機算力約為235P,1000P算力則相當于50萬臺電腦的算力之和。
事實上,這篇報道也是扯淡,鵬城云腦原型系統(tǒng)和鵬城云腦Ⅱ所謂的100P和1000P性能都是低精度的,根本不是雙精度,而報道中世界最強超算的235P則是雙精度浮點運算算力(現(xiàn)在TOP500最強超算是日本富岳,性能513P),這種不談具體半精度、單精度、雙精度,只談多少P的算力完全是在玩弄文字游戲。
錯誤報道根源是廠商有意誤導(dǎo)
這里說明一下,雙精度浮點是64位浮點,可以用來精確存儲2^47以內(nèi)的整數(shù),不會存在任何誤差(47這個數(shù)字有爭議,有說48,52,53等)。單精度是32位的浮點,可以精確的放進一個2^23以內(nèi)的整數(shù),不存在任何誤差。半精度則是16位浮點,精度更低的是INT8、INT4,像單個節(jié)點要求的精度不高的應(yīng)用,比如神經(jīng)網(wǎng)絡(luò)往往采用低精度。就FP64雙精度、FP32單精度、FP16半精度、INT8、INT4進行性能換算的話,大約是以下公式:
超算的FP64雙精度性能=FP32單精度,乘2
超算的FP64雙精度性能=FP16半精度,乘4
超算的FP64雙精度性能=INT8整型,乘8
超算的FP64雙精度性能=INT4整型,乘16
必須強調(diào)的是100P雙精度性能的超算可以執(zhí)行FP64、FP32、FP16、INT8、INT4任務(wù),但1000P半精度浮點性能的AI集群無法執(zhí)行FP64、FP32任務(wù),只能執(zhí)行FP16、INT8、INT4任務(wù)。
換言之,傳統(tǒng)超算適用范圍更廣,而AI集群適用范圍相對有限,特別是無法進行科學運算,無法運行超級計算機的普遍應(yīng)用。
可以說,雙精度、單精度、半精度浮點運算在精度上差距是非常大的,拿1000P的半精度浮點算力“碾壓”235P的雙精度浮點算力,完全就是瞎扯淡。廠商之所對媒體披露“1000P AI集群性能超越235P超算的話術(shù)”,本質(zhì)上就是大忽悠,以至于錯誤報道層出不窮。
之所以出現(xiàn)這么多錯誤報道,究其根源是廠商為了推銷產(chǎn)品,為了搶占輿論高地,糊弄地方政府和老百姓,故意不把話說清楚。只要營造出AI集群非常厲害,在算力上“吊打”世界最強超算,就能夠在輿論上營造出AI集群非常厲害的氛圍,進而間接影響民心,影響地方官員決策。因為普通人缺乏專業(yè)知識,無從了解什么是半精度、單精度、雙精度浮點運算,但1000P比235P要大是都能看懂的,這樣一來,面對傳統(tǒng)超算廠商時,被錯誤報道“洗腦”的地方官員就會覺得,“你這傳統(tǒng)超算才100P,AI集群都1000P了,傳統(tǒng)超算不行,AI集群厲害,上項目就上AI集群”。
事實上,AI集群能做的傳統(tǒng)超算都能做,而傳統(tǒng)超算做的很多任務(wù),AI集群根本做不了,科學運算只能超算來做,氣洞模擬、氣象模擬,以及各種尖端科研項目都必須要超算來做,相比之下,AI集群只能做一些與機器學習相關(guān)的任務(wù)。
就性能來看,AI集群相對于傳統(tǒng)超算壓根就沒有多少優(yōu)勢,誠然,由于半導(dǎo)體技術(shù)的進步,廠商在宣傳時候可以用2021年的AI集群來“吊打”2016年的超算,但只要和現(xiàn)有超算一對比,AI集群所謂的性能優(yōu)勢就蕩然無存了。對于這一點,只要做一個圖表就可以發(fā)現(xiàn),廠商和媒體鼓吹A(chǔ)I集群性能優(yōu)勢只是在玩文字游戲。
結(jié)語
AI集群與超算的關(guān)系類似與專用機和通用機。AI集群的功能只局限于特定的幾項機器學習相關(guān)的任務(wù),而超算則是“十項全能”。誠然,針對特定任務(wù)而言,由于AI集群劍走偏鋒,具有“專用”的優(yōu)勢,在性能功耗比上會優(yōu)于超算。但AI集群只能局限于少數(shù)任務(wù),無法像超算那樣“十項全能”,而且根本無法做對國計民生至關(guān)重要的科學運算。何況現(xiàn)在的超算對AI支持也不弱,特別是超大規(guī)模分布式訓練等場景,相比專用AI集群具有反而具有明顯優(yōu)勢。因此,AI集群是超算的補充,而不是對超算的替換。
長遠來看,超算的國之重器地位是無可替代的。
「 支持烏有之鄉(xiāng)!」
您的打賞將用于網(wǎng)站日常運行與維護。
幫助我們辦好網(wǎng)站,宣傳紅色文化!