技術影響:對 GPU 依賴性的改變

DeepSeek 的新技術展現了以更低硬體成本達到接近最先進 AI 模型性能的可能性。這家中國新創使用約2,048片規格較落後的 NVIDIA GPU(如受美國限制性能的 H800/A100),在兩個月內訓練出參數高達 6710 億 的大型模型 DeepSeek-V3。其總訓練耗時約 280 萬 GPU-小時,成本僅約 560 萬美元(按每小時每卡 $2 美元計)約 3,000 萬 GPU-小時(約為 DeepSeek V3 的 10 倍計算量)。令人矚目的是,Llama 3 使用了更多資源但效果未見得比 DeepSeek-V3 更好。DeepSeek 官方聲稱,其最新模型在推理和推算能力上媲美 OpenAI 和 Meta 最先進的模型,但訓練成本只是其一小部分。

為達成「小硬體、大效能」的突破,DeepSeek 研發團隊採用了多項尖端優化技術:

上述種種創新遠超一般軟體開發對硬體的調校程度,甚至繞過了 NVIDIA 標準軟體棧。DeepSeek 工程師直接使用類彙編級的 PTX 指令進行底層優化,而非典型的 CUDA 函式庫調用。PTX 是介於高階語言(如CUDA C++)和機器碼間的中介層,能對暫存器配置、執行緒/執行緒束(warp)級別進行細粒度控制。DeepSeek 透過 PTX 做出許多 CUDA 無法實現的調優,例如劃分硬體資源執行壓縮/解壓任務和排程更高效的執行緒併發 。這種極致優化難度極高,維護成本大,也顯示 DeepSeek 工程團隊具備非凡實力 。全球 GPU 供應緊張和美國出口管制的外在壓力,反而促使 DeepSeek 走上軟硬體協同創新的道路,達成降低硬體依賴的突破。

AI 計算架構角度看,DeepSeek 的成果可能帶來幾點重要影響:

DeepSeek 模型在性能與成本上的表現遠優於許多西方對手:圖中縱軸為模型在 MMLU 基準上的分數(越高越好),橫軸為 API 計算成本(對數刻度)。DeepSeek-R1(紅點)達到約 93 分性能,但每百萬字元輸入成本僅約$0.1,美國的 GPT-4.0(藍點)成本高約一個數量級。低成本高效能的模型問世使市場質疑是否有必要繼續大規模增購昂貴 GPU 硬體。

綜上,DeepSeek 展現的技術趨勢是提高每顆 GPU 的有效產出,減少為提升性能而無限擴充硬體的必要。這可能緩解企業對最新 NVIDIA GPU 的絕對依賴,但不代表 NVIDIA 硬體會被棄用——相反,這些突破多半仍是在 NVIDIA 架構上實現的,只是方法論上更為高效。未來 AI 計算架構將更強調軟硬體結合的整體效率,NVIDIA 也需要因應這種趨勢,提供更高性價比更靈活的加速方案,以保持技術領先。

市場與財務影響:GPU 需求與訂單展望

DeepSeek R1 的發布在資本市場引發了明顯震盪,投資者擔憂 NVIDIA 賴以高速成長的 AI GPU 需求前景可能生變。NVIDIA 股價在消息傳出後大幅下挫,單日市值蒸發一度高達 5900 億美元,創美股史上最大單日市值損失紀錄。雖隨後股價有所反彈,但幾天內累計仍跌去約 9%(約數百億美元市值)。不僅 NVIDIA,一眾 AI 晶片股都受此拖累下跌,足見市場對未來GPU需求放緩的擔憂相當普遍。下表列出當週 NVIDIA 股價的劇烈波動:週一暴跌,週二反彈大半,週三又回落,反映投資人心態的反覆。

造成恐慌的核心原因在於:DeepSeek 以廉價硬體達成高階 AI 的事實,動搖了華爾街對 NVIDIA GPU *「需求永續增長」*的信心。過去兩年,全球超大規模雲端(如 AWS、Azure、Google)為了AI訓練投入了數十億美元,添置了無數 NVIDIA A100/H100 等GPU,加速中心的建設。這些資本開支背後的假設是:更大的模型需要更多的GPU,唯有持續購買高階晶片才能保持競爭力。但 DeepSeek R1 的橫空出世提出了一個相反的問題——如果新的AI模型可以用更少或更廉價的硬體訓練,超大廠們是否還需要繼續大舉採購GPU?DeepSeek 官方在社交媒體上宣稱 R1 推理耗費僅為 OpenAI 模型的1/20~1/50 ;另一份投行報告則估計 DeepSeek 模型訓練效率比對手高出45倍 。如此巨大的成本差異讓投資者開始重新評估 NVIDIA GPU 定價權和需求彈性:未來客戶是否會減少對昂貴最新GPU的購買,轉而尋求更經濟的解決方案?

對 NVIDIA 而言,其主要客戶群的採購動向至關重要。其中包括雲服務商(如亞馬遜 AWS、微軟 Azure、Google Cloud)和科技巨頭(如Meta、OpenAI等)。這些公司既是 NVIDIA 數據中心級 GPU 最大的買家,也是最有能力實現 DeepSeek 式創新的團隊。DeepSeek 的突破可能使他們調整AI基礎設施投資計劃

儘管市場一度風聲鶴唳,但也需注意長期需求的另一面:低成本的 AI 模型可能催生新的應用增長,反而帶來更多元化的硬體需求。UBS 等機構指出,DeepSeek 的出現並未動搖 AI 整體成長趨勢,因為 AI 並非零和遊戲。更高效的模型降低了應用門檻,預期AI 部署會更加普及,最終仍會擴大對算力的總需求,只是由不同類型的產品來滿足。事實上,在 DeepSeek 事件後,美國科技巨頭並未削減AI投入:Meta 宣布將在 2025 年投入 600~650 億美元擴充 AI 基礎設施,GPU 規模計畫擴大一倍,達到 130 萬顆之譜。這意味即便一部分模型訓練更省硬體,整體上大公司仍選擇繼續砸錢確保 AI 領先。對 NVIDIA 而言,短期股價雖受挫,但其訂單能見度可能仍維持高位——特別是來自願意不惜重金佈局AI的客戶(例如 Meta、OpenAI/Microsoft 等),仍將帶來可觀的 GPU 需求。

綜合來看,DeepSeek 讓市場重新審視了 AI 算力供需的平衡:NVIDIA 超高速增長預期受到挑戰,投資者開始考量競爭與需求彈性,但同時 AI 熱潮並未降溫,只是正朝著更經濟高效的方向演進。NVIDIA 未來的業績走向,將取決於它能否在這種新平衡下持續説服客戶——購買它的新產品仍是最具價值的選擇,而不僅僅依靠軟體優化或替代方案。

競爭環境:自研晶片潮與 DeepSeek 優劣勢分析

DeepSeek 的崛起發出了明確信號:AI 硬體與架構領域的競爭將進一步加劇。長久以來,NVIDIA 在AI加速領域幾乎處於壟斷地位,但如今各路玩家看到繞開NVIDIA技術路線的可能性,預計會加大投入,打造屬於自己的AI解決方案。這種競爭態勢主要體現在兩個層面:

  1. 硬體研發競爭加劇:DeepSeek 的成功雖然是在 NVIDIA GPU 上實現,但它證明了高效演算法可部分替代硬體性能提升。這可能激勵更多公司發展專用AI晶片(ASIC)或加速器,優化特定AI工作負載,進一步降低對通用GPU的需求。事實上,AI 硬體市場近年已湧現多元化趨勢:在模型推理階段,許多專用ASIC、小型GPU晶片甚至高性能CPU都能勝任部分工作,對 NVIDIA 高端GPU形成補充乃至競爭。例如,谷歌的TPU在雲端推理上提供高性價比,亞馬遜的Trainium專用晶片針對訓練任務推出,Tesla自研Dojo晶片加速自動駕駛訓練等。DeepSeek 刺激下,這類自研潮可能更旺盛:每個超大廠都不想在核心AI能力上受制於人。長遠看,NVIDIA 將面對一個更加「群雄並起」的競爭環境——不僅有傳統GPU對手 AMD、習慣CPU領域的 Intel,還有眾多初創和垂直巨頭自帶的ASIC/FPGA方案。在中國,DeepSeek 更被視為突破美國晶片封鎖的樣板。可以預見,中國政府和企業會投入更多資源發展本土AI芯片和大型集群方案,減輕對NVIDIA進口貨的需求,這對 NVIDIA 的市場版圖是一大潛在威脅。
  2. 軟體開源與模型生態競爭:DeepSeek V3/R1 採取的是開放權重策略(Open-Weight Models)。這與 OpenAI 封閉GPT-4形成對比。在矽谷和AI研究界,越來越多聲音支持開源模型,讓社群共同改進。DeepSeek 的成功為開源超大模型正名,說明即使缺乏最新硬體,透過開源協作也能誕生一流模型 。這可能促使更多企業加入開源模型開發,與 NVIDIA 深度綁定的封閉生態分庭抗禮。開源模型普及後,使用者可以在本地或自有伺服器上運行AI,而不一定依賴商業雲端服務——間接減少了對提供這些雲服務所需GPU基礎設施的需求增量。對 NVIDIA 而言,這種「軟體民主化」意味其未來的成長不僅取決於硬體性能,還取決於能否融入並支持蓬勃發展的開源AI生態。值得注意的是,DeepSeek 雖強調開源,但其高效實現仍依賴高度定制的軟硬體結合,非一般公司能輕易複製。因此在短期內,DeepSeek 的影響主要還是心理層面——讓產業看到另類途徑可能可行。但從長期來看,它改變了賽局的敘事,各競爭者勢必加速追趕以免落後。

DeepSeek vs. NVIDIA(Blackwell 架構):深入比較 DeepSeek 技術和 NVIDIA 現有/未來技術,可以看到雙方各有優劣:

總的來說,DeepSeek 雖撼動了 NVIDIA 的地位,但短期內很難動搖 NVIDIA 在高端AI加速器市場的主導。真正值得關注的是它引發的連鎖反應——各大公司加速自研、產業更加多元化。NVIDIA 正面臨它在 AI 時代以來最嚴峻也最刺激的競爭局面:不再是一枝獨秀,而是百家爭鳴。未來 NVIDIA 能否保持高成長,取決於其持續創新能力以及在新競爭環境下調整策略的靈活度。

長期影響:NVIDIA 的未來戰略與應對

DeepSeek 引發的技術變革,對 NVIDIA 的長遠策略帶來深刻啟示。展望未來,NVIDIA 業務模式和產品佈局可能出現以下演變,以積極應對新的行業格局:

總結而言,DeepSeek 帶來的衝擊短期令 NVIDIA 承受壓力,但長期可能成為 NVIDIA 蛻變的契機。NVIDIA 一方面將加速技術創新(如推出更契合新型模型的 Blackwell GPU),另一方面會調整市場打法以適應新環境。對 NVIDIA 這樣的平台型公司而言,最終勝負取決於能否繼續引領AI計算的方向:既提供無與倫比的性能,也提供靈活高效的解決方案。在AI需求依舊旺盛的大趨勢下,“變”與“不變”將交織塑造 NVIDIA 的未來。不變的是對算力極限的追求,改變的是實現方式——從純堆砌硬體轉向軟硬並進、服務拓展。只要 NVIDIA 能順勢而為,深耕其生態優勢並擁抱效率革命,它仍有望在群雄逐鹿的AI時代維持領先地位,繼續扮演關鍵的算力提供者角色。

參考資料

  1. VanEck博客:《DeepSeek’s Disruption: The Impact on Nvidia and the Semiconductor Industry》 (DeepSeek’s Disruption: The Impact on Nvidia and the Semiconductor Industry | VanEck) (DeepSeek’s Disruption: The Impact on Nvidia and the Semiconductor Industry | VanEck) (DeepSeek’s Disruption: The Impact on Nvidia and the Semiconductor Industry | VanEck)
  2. Understanding AI 專欄:《I don’t believe DeepSeek crashed Nvidia’s stock》 (I don’t believe DeepSeek crashed Nvidia’s stock) (I don’t believe DeepSeek crashed Nvidia’s stock) (I don’t believe DeepSeek crashed Nvidia’s stock) (I don’t believe DeepSeek crashed Nvidia’s stock)
  3. Reuters 專稿:《What is DeepSeek and why is it disrupting the AI sector?》 (What is DeepSeek and why is it disrupting the AI sector? | Reuters) (What is DeepSeek and why is it disrupting the AI sector? | Reuters) (What is DeepSeek and why is it disrupting the AI sector? | Reuters)
  4. Tom’s Hardware 新聞:《DeepSeek’s AI breakthrough bypasses industry-standard CUDA…》 (DeepSeek’s AI breakthrough bypasses industry-standard CUDA for some functions, uses Nvidia’s assembly-like PTX programming instead | Tom’s Hardware) (DeepSeek’s AI breakthrough bypasses industry-standard CUDA for some functions, uses Nvidia’s assembly-like PTX programming instead | Tom’s Hardware) (DeepSeek’s AI breakthrough bypasses industry-standard CUDA for some functions, uses Nvidia’s assembly-like PTX programming instead | Tom’s Hardware)
  5. BankInfoSecurity 報導:《Nvidia’s Huang: DeepSeek Fuels Explosion in AI Compute Needs》 (Nvidia’s Huang: DeepSeek Fuels Explosion in AI Compute Needs) (Nvidia’s Huang: DeepSeek Fuels Explosion in AI Compute Needs) (Nvidia’s Huang: DeepSeek Fuels Explosion in AI Compute Needs)
  6. U.S. Global Investors 專欄:《China’s AI Breakthrough Sends NVIDIA Reeling…》 (China’s AI Breakthrough Sends NVIDIA Reeling and Sparks National Security Fears – USGI) (China’s AI Breakthrough Sends NVIDIA Reeling and Sparks National Security Fears – USGI)

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *