DeepSeek V4的劃時代戰略意義:中國可以有自己的獨立大模型
DeepSeek V4的劃時代戰略意義:中國AI晶片與大模型路線圖清晰了,美國AI路線末日前景可以看到了。
----這個圖可能是假的。不過文中的原理是通的。
1. 為什麼「一塊H200都沒買」?
這是美國商務部長盧特尼克說的,在4月22日國會聽證會上明確表示:“迄今為止,他們一塊晶片也沒買。”
說實在的,我有些吃驚。因為算力緊缺是肯定的,特別是用來訓練的。一些頭公司據說有購買意願。
沒買,唯一的原因就是國產化路線。昨天DeekSeek V4發布,性能方面不出預料,進步巨大但不太驚喜,沒有原生多模態是要補的短板。但是,它是國產AI晶片與大模型路線圖劃時代的進步,局面一下清楚了。
從技術上來說,中國確實不需要花大錢買一堆限制的H200。也不需要英偉達CUDA系統了,堅定地走自主創新道路,所有條件都具備了。一塊都不買,就是最好的決心展示。
如果買,一塊H200單卡19萬人民幣,中國訂單很可能超過200億美元,後續可能更多。現在,這些錢都是華為和其它中國AI晶片公司的潛在收入來源,對自主體係有決定性作用。
2. 基於7nm的AI晶片、基座大模型、大模型應用自主全產業鏈
但是,擺脫英偉達晶片和CUDA的底氣,必須是實打實的技術表現,不能喊口號。 DeekSeek V4的發布,最大的戰略意義就在這裡,它和華為昇騰950深度綁定。
任正非罕見地轉送全公司郵件給梁文鋒,這事的意義確實有這麼大。
Deepseek V4向華為全公司開放,萬人先試用了,許多員工說,改變了工作方式。注意這是昨天公佈之前,是華為率先內測福利,很可能是跑在華為晶片和架構上。這是大模型應用,華為的人用起來了。
華為昇騰晶片,應該是SMIC 7nm工藝,是ASML的DUV光刻機。即使國產光刻機還沒突破7nm領域,還在奮戰28nm量產,中國AI晶片也有辦法發展。
假設SMIC 7nm產能每月7萬片,其中2萬片給國產AI晶片。每片良率不高只有30%,也有100個活的die,每月有200萬塊,一年2000萬塊以上。英偉達賣中國H200也就是百萬塊規模,就算中國晶片3塊頂一塊H200,總算力也夠了。所以,黃仁勳著急了。
DeepSeek V4是水平足夠的基座大模型,和完全國產化的華為AI晶片深度綁定,又能嵌入華為員工的工作流程中。這就是全端閉環。
中國AI晶片是7nm,和美國基於3-5nm的效能差距,但是製程差距其實沒那麼大。用於大模型的GPU,單卡效能不關鍵,要看系統表現,特別是運算效能重要性大幅下降。資料傳輸、儲存的意義比運算還大,GPU大部分時間在等數據,而不是運算。而並行就是加速的最大武器,不是4nm比7nm強,而是1.6T比800G翻倍。
資料傳輸需要晶片先進封裝,Chiplet技術等等,中國落後不多。不需要國產光刻機突破,中國自主的AI晶片和大模型也能加速發展了。而且下定了決心,和英偉達說再見。
3. 美國晶片與大模型性能優勢不可怕
美國現在完全押寶大模型了,頭部公司營收有突破,Anthropic在私下股權轉讓時估值上萬億美元了。現在國產大模型性能上和美國三頭還有差距。
但是,不要被這個優勢嚇到。沒有什麼物理原理能限制國產大模型追趕、超越。不需要等國產光刻機性能突破,時間已經是我們的,發展腳步沒有卡住。
美國大模型效能優勢,無非就是兩個基礎。一個是算力,一個是應用經驗。還需要開發人員,美國AI主要就是靠華人,中國頂尖研發人員數量和水準不會有問題,不夠也可以培養,因為算力不足還格外需要想辦法。
算力方面,中國會用並行,以及足夠的國產GPU組成昇騰950超節點這種架構來解決問題。一年上千萬塊國產GPU晶片,集中起來算力也不小。
中國還有個絕招,大模型開源。美國一些公司會用美國晶片和伺服器,跑中國大模型。這等於是美國算力幫中國大模型搶市佔率。一旦中國開源大模型效能追平、追近,對美國頭大模型公司商業模式就是毀滅性打擊。
大模型應用經驗,美國領先。但這無非就是不斷用,收集資料和案例不停迭代。中國公司也開始快速迭代了,也會進步。雖然說還有差距,但是沒有什麼物理規律說美國大模型表現一定領先,時間差距無非就是幾個月。一旦美國大模型進入瓶頸期,很快就追上了。
那時,我都敢宣布美國AI路線圖完了,巨額投資賺不回來了,被中國開源大模型打死了。這會是美國AI的末日。
