2022年8月31號,正當筆者和朋友探討國產GPGPU(通用圖形處理器)的發展之時,突然得知了一條爆炸性的消息,美國有關部門宣布對中國禁運先進制程大規模GPGPU,涉及到的是英偉達的100系列和AMD的MI系列當中較為先進的型號,性能高于英偉達的A100的板卡,將會全部禁售。聯想到前段時間剛剛討論過的芯片法案,新的制裁就這么不聲不響的到來了。
而這個消息也僅僅持續了2-3天,英偉達隨后披露了制裁的詳細文件,到2023年9月1日之前,中國本土地區(含港澳)的訂單依然可以正常收發貨,但是之后將會受到美國有關部門的管控。
為什么是它們?
與眾所周知的GA102芯片不同一樣的是,A100所使用的GA100芯片在設計規格上更大更激進,前者用的是三星的便宜貨8納米制程,面向的是消費級和基礎工業級市場,存儲接口預留的是相對性能尚可,價格也不算高的GDDR6/GDDR6X,最后成品也就是大家熟悉的3080/3090系列;
而后者是英偉達專門為高等級AI和科學計算準備的,制程上用的是臺積電7納米,面積上多了200平方毫米,接近一般芯片尺寸的上限850平方毫米,晶體管數更是達到了542億之多;特別是存儲接口選擇了更貴,帶寬也更大的HBM2e,最多可以在封裝中集成80G的HBM2e顯存,顯存讀寫速度數以T計,兩者之間的速度差距在2-3倍左右。當然1萬多美元一塊乞丐版A100的價格也讓很多小伙伴不得不掂量下自己的錢袋子,比如筆者所在公司的人工智能相關項目經常就用3080和3090代替A系列專業卡,特別是A100的存在。
而名單上另一個名字,H100,則是英偉達還沒正式發售的面向未來的千億億次AI超算的主要算力負載芯片,第一個在價格爆炸的臺積電4納米下再次挑戰了一般芯片尺寸的上限的家伙,在814平方毫米的尺寸下,集成了整整800億顆晶體管,完全體的參考功耗預計能輕松突破1馬力,也就是735瓦。
至于另一家被大家戲稱為農企的AMD,他們出現在禁運名單里的MI250X,第一個用戶就是現在公開的美國E級超算Frontier,利用MI250X優異的性能,Frontier不但邁過了百億億次大關,同時還完成了成為了第一個跨過50T算力每千瓦功耗的超算;我們在2年以前討論過的日本超算富岳,當時費勁心力,也僅僅是達到了16T算力每千瓦功耗的指標;同樣是臺積電7納米制程,在同樣的功耗,AMD能達到日本人三倍的性能,不得不說,AMD是有設計上的獨到之處的。
目標是誰?
前段時間,我們談到過美國本次芯片法案針對中國的不僅僅是芯片制造,還有2000億美元投資是針對基礎科學的重點進攻,其中AI和高性能科學計算方向是重點之一,雙方將會在相關領域展開激烈的廝殺。至于這一輪的制裁目標,有的人說靶子是人工智能企業,也有人說目標是國家超算中心,這兩個都只能說放在這里并不適當。
人工智能企業一般根據自身情況,會考慮少量采購輔助大量租賃相關板卡的方案,或者直接從云計算廠商租賃計算小時進行模型訓練,如果自身用量較大,會選擇類似特斯拉和谷歌那樣,自研相關芯片用于生產實踐,特斯拉的Dojo和谷歌的TPU,都是自研方案的代表,國內企業當中BATH也都有類似的自研方案投入了實際運用。
特別是在現在經濟下行階段,前幾年購買的GP100和V100雖然慢了點,但也沒到隨便亂丟的時間點。而用于實際現場商用的模型推斷的話,可選的方案就非常多了,各類邊緣計算板卡,FPGA,NPU方案可以說是百花齊放,則并不一定要使用這么昂貴的方案。
而國家超算中心層面,上次大規模使用英偉達和AMD兩家的GPU進行并行計算還得追溯到10多年前,天河1號上的HD4870X2和天河1號A上的M2050,和如今相比,天河1號系列的算力差了1000倍之多。在那之后,所有的國家超算中心,就直接被美方禁運了英偉達和英特爾方案的芯片。
所以說國家超算中心層面采購這三款板卡用于百億億次超算的使用,不得不說,沒那個可能性,也沒那個必要性。特別是去年清華大學和阿里達摩院曾在某海外刊物上發表過著名的人工智能超大模型的論文《如何在3700萬核的系統上模擬人腦級別的人工智能模型預訓練》,從側面暗示了國產新一代自主百億億次級超算,除了FP64性能上處于絕對領先之外,在AI極大規模模型訓練上也可以部分代替英偉達板卡實現相關功能。
盡管我們的最先進的大芯片制程僅僅只有受到美國人管制的中芯國際14納米,盡管我們的超算可能相比對手的更耗電,但是我們依然可以說我們并不比競爭對手落后。芯片制程落后不代表我們不能利用美國人20年以前放棄的相關技術,獨自魔改出足夠和對手直接競爭的對等產品。
當然也有的老板會選擇蹭熱點,比如說小鵬汽車的創始人何小鵬說自己已經囤積了足夠的相關板卡用于AI數據中心的建設投入。但一言蔽之說制裁和禁運會造成多么巨大的影響的也未免有點過于武斷了些。所以分析下來看,其實美國這一輪出招下來,表態的意義大于實質,實際上美方也沒想清楚禁運的目標到底是什么。
而一部分地區招商引進的人工智能云計算廠商,特別是建立在相關軟件生態體系下的,可能反而是現在受影響最大的,他們過于依賴英偉達的全套方案,硬件和軟件都是英偉達的,這就失去了退路。
美國人還有什么后手?
2013年美國人禁運了我們超算上的服務器芯片,2019年禁運了我們的EUV光刻機,2020年禁運擴大到整個相關設備,今年又擴大到A100和H100在中國本土地區的廣泛使用,后續可能還會對ARM架構服務器和DPU進行禁運。同樣,因為第一款GAA芯片是中國設計韓國三星3納米制程生產的礦機芯片,美國人已經對設計GAA的相關軟件進行了禁運,以限制中國企業在相關領域繼續獲得相應的設計能力。
后續可能會進一步擴展到對28納米以上相關設備和耗材的禁運,還會針對現有的國產設備企業的國產化半導體生產設備進行定點打擊,制裁里面的美國產零部件,同時禁運高等級的檢驗檢測設備。總之在一個較長的時間之內,逐步逐步的通過文火悶燉的方式,一步一步絞殺我們的整個產業。
我們該怎么辦?
現在制裁和禁運的大錘已經落下,我們不得不面對這些問題,只能采取一些必要的措施了:
1. 國內的先進制程開發不能斷線,SW26010升級為26010P,工藝制程從28納米升級到14納米,性能提升了接近5倍,由此可見,架構迭代與制程進步帶來的性能進化是巨大的,哪怕每代進步實際達到30-50%都是非常劃算的。現有的國內先進制程的極限,如果能保證10-25%的大芯片良率,輔助以必要的缺陷管理,在商業上是足以成功的。我們不能保證我們的生產出來的芯片每一片都完美無缺,但是我們可以用設計和封測兩個方向去屏蔽不良的工作區,這樣就把本來不合格的芯片變為合格品了。
2. 加大對兩個美國企業在華團隊的支持,推動他們將核心開發團隊放在中國本土,通過智力資源對相關業務進行鎖定,讓美國人不得不面對,美國企業研制的先進制程芯片,是在中國本土由中國工程師設計的。這次我們就看到了英偉達為中國團隊申請了相關豁免,中國團隊的工程師將會繼續參與相關芯片的設計開發。
3. 繼續扶持現有的創業公司,并支持他們做大做強,我們很幸運的看到國內已經出現了3-4家相關方向的企業已經開始進行相關研發,其中天數智芯和壁仞已經用臺積電工藝做出了足夠先進的方案,能夠和英偉達們扳一下手腕了。我們也期待他們真正能在商業上成功,而不是僅僅依靠融資和資本市場上說故事來維持公司運營。
4. 在軟件層面組建相關行業聯盟,促進各家企業的解決方案在底層計算上使用原創性的公共接口,而不是現在這種,移植cuda部分代碼加一點自己造的輪子就變成了自研軟件平臺了。
總之,一方面我們需要推動自己的方案能真正被高校學生和相關科研人員大規模用起來,另一個方面推動我們的制造能力能得到大幅度提升,芯片產業不同于兩彈一星的最重要的一點是,需要我們的芯片在商業上是成功的,而我們每一個人,也都期待著,“租不如買,買不如自己造”的那一天。
總之還是如上篇文章《美國芯片法案來了,這次能鎖死中國嗎》中所說的,從18年貿易戰以來,不斷有聲音質問中國何必什么都要自己造,為什么不老老實實用西方的東西。是我們非要什么都自己造嗎?當然不是。現實是放棄自己制造的能力,就只能接受西方高昂的價格,以及各種附加的苛刻條件。目前我們能做的唯有放棄幻想,獨立自強。
「 支持烏有之鄉!」
您的打賞將用于網站日常運行與維護。
幫助我們辦好網站,宣傳紅色文化!