GPT-4o 圖像生成更新引發的風潮分析:吉卜力風格流行及其對GPU 需求的影響
1. 引言:GPT-4o 圖像生成現象與吉卜力趨勢
OpenAI 於 2024 年 5 月發布了 GPT-4o,這款模型以其多模態能力而備受矚目,然而,當時承諾的圖像生成功能卻並未隨之推出 1。這項功能的延遲發布暗示了將高質量的圖像生成整合到多模態模型中的複雜性,以及可能與之相關的資源需求。最終,這項整合的圖像生成器於 2025 年 3 月 25 日左右向所有 ChatGPT 用戶推出,包括免費方案的用戶(最初由於需求過高,免費用戶的存取有所延遲)2。此次整合使得用戶可以直接在聊天介面中創建、編輯和優化圖像,標誌著人工智慧藝術和視覺內容創作領域的一個重大進步 1。廣泛的可用性,甚至包括有限制的免費存取,表明 OpenAI 旨在普及先進的人工智慧圖像生成技術 2。免費用戶最初的延遲也預示了這項功能可能帶來的巨大計算壓力。
在發布後不久,社交媒體平台上便出現了一股顯著的趨勢,用戶紛紛利用 GPT-4o 將自己的照片和其他主題轉換為吉卜力工作室動畫的獨特風格 4。這種「吉卜力化」的趨勢是由於該模型能夠精確地模仿《神隱少女》和《龍貓》等標誌性電影中柔和、手繪、水彩般的風格 4。吉卜力工作室在全球範圍內享有盛譽且深受喜愛的藝術風格,其鮮明的視覺特徵和積極的情感聯想,使其成為人工智慧驅動轉型的理想目標。
本報告旨在分析 GPT-4o 圖像生成更新、隨之而來的吉卜力風格趨勢,以及由此對圖形處理單元(GPU)需求產生的影響。報告的後續章節將深入探討 GPT-4o 的主要功能、吉卜力風格趨勢的驅動因素、圖像生成所需的計算資源、發布後對 GPU 市場的即時和長期影響、與其他人工智慧圖像生成模型的比較分析,以及專家觀點。
2. 理解 GPT-4o 圖像生成更新:主要功能與改進
與先前依賴外掛程式或 DALL-E 等獨立工具不同,GPT-4o 擁有完全整合的圖像生成功能,直接位於 ChatGPT 介面內 1。這種整合的工作流程讓用戶可以在相同的對話環境中生成、編輯和優化圖像,無需在應用程式或標籤之間切換 1。這種原生整合顯著提升了用戶的便利性,並促進了更直觀和迭代的創作過程。透過將圖像生成直接嵌入到對話式人工智慧中,OpenAI 降低了使用門檻,並鼓勵用戶更自然地將視覺效果融入到他們的對話和創意工作中。這種緊密的整合也使模型能夠利用正在進行的對話的完整上下文來生成更相關的圖像。
GPT-4o 在功能方面進行了顯著的增強 1:
- 上下文感知: GPT-4o 能夠理解對話的完整上下文,包括先前的互動和上傳的圖像,從而產生更自然、更符合品牌且更易於調整的圖像結果 1。
- 高質量和多樣化的視覺效果: 該模型可以根據簡單的提示生成高質量、逼真或風格化的視覺效果,滿足廣泛的創意需求 1。
- 精確的文本渲染: GPT-4o 擅長在圖像中精確地渲染文本,這對於創建菜單、標誌、標籤和資訊圖表等視覺內容至關重要 1。
- 改進的提示遵循能力: 該模型展現出更強大的能力來遵循包含多個細節的提示,能夠在單個圖像中處理多達 10-20 個對象,這比舊模型有了顯著的提升 1。
- 透過聊天進行逐步優化: 用戶可以透過自然的對話逐步建立和優化他們的圖像,添加細節並請求更改,而無需重新開始,因為 GPT-4o 會記住對話的上下文 1。
- 選擇性圖像編輯: GPT-4o 允許用戶選擇圖像的特定部分,並使用簡單的文本命令僅對該區域應用編輯,從而提供對輸出的精細控制 1。
- 從上傳圖像中進行情境學習: 該模型可以分析並學習用戶上傳的圖像,將其細節、風格或構圖無縫地整合到生成的視覺效果中,實現風格轉換和視覺靈感 1。
這些進步共同將 GPT-4o 定位為比其前身更強大、更通用且更易於使用的人工智慧驅動視覺內容創作工具。上下文理解、文本渲染、提示遵循和迭代優化方面的改進解決了早期人工智慧圖像生成器的一些關鍵限制,使 GPT-4o 更適合廣泛的實際和創意應用。情境學習功能為用戶使用自己的視覺參考個性化和指導圖像生成過程開闢了令人興奮的可能性。
OpenAI 在 GPT-4o 的圖像生成功能中融入了多項安全機制,以防止創建有害或不當的內容 1。這包括自動阻止暴力、性、仇恨或非法圖像,以及限制生成未成年人的逼真圖像或冒充私人個體 1。公眾人物可以選擇退出系統,要求不使用他們的肖像進行生成 1。所有生成的圖像都嵌入了 C2PA 元數據,以清晰地表明它們是人工智慧生成的,從而提高透明度並打擊錯誤資訊 1。積極整合安全措施突顯了 OpenAI 對負責任的人工智慧開發和部署的承諾,解決了與強大圖像生成技術相關的潛在倫理問題。透過實施這些保障措施,OpenAI 旨在降低濫用風險,並為用戶探索人工智慧圖像生成的創造潛力創造更安全的環境。C2PA 元數據提供的透明度對於建立信任和區分人工智慧生成的內容與人類創建的視覺效果至關重要。
儘管取得了這些進步,GPT-4o 的圖像生成仍然存在一些限制,包括偶爾在裁剪長圖像、清晰地渲染小字體或密集文本以及保持面部編輯的一致性方面存在問題 1。該模型在處理涉及非拉丁字符的多語言文本時也可能遇到困難,並且在編輯圖像的特定部分時可能會出現不一致的情況 1。在提示模糊的情況下,該模型可能會生成不準確的細節或「幻覺」2。處理包含大量不同對象(超過 10-20 個)的提示也可能具有挑戰性 2。認識並公開這些限制表明 OpenAI 意識到持續的開發需求,並為用戶提供了切實的期望。透過承認這些缺點,OpenAI 為未來的改進奠定了基礎,並鼓勵用戶提供可以指導進一步開發工作的回饋。這也突顯出,雖然 GPT-4o 代表了巨大的飛躍,但它並非所有圖像生成任務的完美解決方案。
3. 吉卜力風格圖像生成的病毒式傳播:探索趨勢及其驅動因素
吉卜力工作室由宮崎駿共同創立,以其精美的手繪動畫而聞名,這些動畫的特點是色彩鮮豔的水彩、大眼睛的角色、夢幻般的場景以及童真奇遇與深刻主題的獨特融合 6。其關鍵元素通常包括奇特的生物、魔法景觀、飛行城堡、森林精靈以及堅強而真誠的角色 8。吉卜力工作室在全球範圍內廣受認可和喜愛的藝術風格具有強烈的視覺標識並能喚起積極的情感,使其成為人工智慧驅動轉型的理想目標。吉卜力電影獨特的藝術元素和情感深度在全球範圍內培養了龐大而忠實的粉絲群。這種既有的親和力很可能極大地促成了以這種風格生成圖像的病毒式熱情。
GPT-4o 展示了準確模仿不同藝術風格的驚人能力,包括吉卜力工作室動畫的特定美學 4。用戶發現,僅僅在提示中包含「吉卜力風格」通常就足以獲得令人信服的結果 6。該模型可以有效地捕捉吉卜力電影特有的柔和水彩質感、夢幻光線和奇幻細節 6。GPT-4o 增強的視覺風格理解能力及其將文本描述轉化為相應藝術輸出的能力對於推動吉卜力趨勢至關重要。該模型對大量圖像和文本數據的訓練可能使其能夠學習與吉卜力工作室相關的複雜視覺模式和風格細微差別,從而實現準確且美觀的風格轉換。
使用 GPT-4o 生成吉卜力風格的圖像非常簡單,幾乎不需要任何技術專業知識 7。用戶可以透過文本提示描述他們想要看到的吉卜力風格的場景或角色,也可以上傳現有的照片並要求模型進行轉換 7。用戶友好的介面和簡單的提示過程降低了使用門檻,使包括沒有人工智慧藝術生成經驗的用戶在內的廣泛受眾都能參與到這個趨勢中。ChatGPT 對話式介面的直觀性,加上 GPT-4o 理解自然語言提示和處理上傳圖像的能力,使得用戶可以非常容易地試驗吉卜力風格,從而促成了其迅速傳播。
對於許多用戶,尤其是那些看著吉卜力工作室電影長大的人來說,看到自己、他們的寵物或熟悉的場景以這種備受喜愛的風格呈現,喚起了強烈的懷舊和喜悅之情 4。將自己的照片轉換成吉卜力風格的肖像的個性化性質為這個趨勢增添了獨特且充滿情感共鳴的維度 4。與吉卜力工作室作品的情感聯繫以及個性化人工智慧生成藝術的能力極大地促進了這個趨勢的病毒式傳播和文化影響。與吉卜力電影相關的積極聯想和美好回憶使人工智慧驅動的轉變成為許多用戶愉悅且引人入勝的體驗,促使他們分享自己的創作並進一步推動這個趨勢。
社交媒體平台成為用戶分享他們吉卜力風格人工智慧創作的主要管道,從而實現了廣泛的曝光並鼓勵其他人加入這個趨勢 4。這個趨勢引起了各種媒體的關注,甚至像 OpenAI 執行長山姆·阿爾特曼這樣的知名人士也參與其中,進一步擴大了其影響力 4。品牌也開始利用吉卜力風格進行宣傳內容,以利用這個趨勢的受歡迎程度 6。生成藝術的視覺特性,加上社交媒體平台固有的可分享性,形成了一個強大的回饋迴路,加速了這個趨勢的發展和影響力。吉卜力風格藝術的視覺吸引力和情感吸引力使其非常適合在社交媒體上分享。隨著越來越多的用戶參與並分享他們的創作,這增加了該趨勢的曝光率,吸引了更多參與者並產生了巨大的轟動。
4. GPT-4o 圖像生成的計算需求:分析資源需求
與先前的模型相比,使用 GPT-4o 生成圖像通常比生成文本需要更長的時間,平均生成時間從大約 30 秒到 2 分鐘不等,具體取決於複雜程度 1。這表明與早期的基於文本的互動,甚至可能與先前的圖像生成模型相比,計算負載更高。雖然提供的片段中沒有明確提供與先前 OpenAI 模型(如 DALL-E 2)的計算資源的直接比較,但在 GPT-4o 發布後 OpenAI 的 GPU 基礎架構承受了巨大的壓力,這暗示了圖像生成資源消耗的顯著增加 17。GPT-4o 增強的質量、細節和功能是以比其前身更高的計算需求為代價的。GPT-4o 在架構、訓練數據以及諸如改進的文本渲染、處理更複雜的提示和實現多輪優化等功能方面的進步,可能需要在圖像生成過程中消耗顯著更多的處理能力和記憶體存取。
人工智慧圖像生成,尤其是像 GPT-4o 可能基於的擴散模型,具有高度的並行性,因此嚴重依賴 GPU 的並行處理能力來實現高效計算 17。GPT-4o 圖像生成(尤其是吉卜力風格趨勢)空前的受歡迎程度導致 OpenAI 的 GPU 資源需求立即且顯著地激增 17。OpenAI 執行長山姆·阿爾特曼關於他們的「GPU 快要熔化了」的說法生動地說明了圖像生成功能的廣泛採用所造成的巨大計算壓力 13。GPT-4o 圖像生成的受歡迎程度與報告的 GPU 過載之間存在直接的關聯,這突顯了大規模運行此功能所需的巨大計算資源。GPU 的並行架構非常適合使用深度學習模型生成圖像所涉及的矩陣乘法和其他計算。大量用戶對 GPT-4o 的圖像生成請求迅速超過了 OpenAI 現有的 GPU 容量,導致了比喻意義上的「熔化」點。
雖然提供的片段中直接比較有限,但關於其他模型的信息表明計算需求各不相同。例如,Stable Diffusion 被設計為可以在具有足夠 VRAM 的消費級 GPU 上運行,這表明個人用戶的硬體要求可能較低,儘管大規模部署仍然需要大量的 GPU 資源 23。Midjourney 在其自身的伺服器基礎架構上運行,從而將最終用戶的直接 GPU 需求抽象化 9。DALL-E 3 的 GPU 需求沒有明確說明,但鑑於 GPT-4o 的進步和報告的基礎架構壓力,DALL-E 3 的需求可能較低 27。GPT-4o 對更高質量、更複雜的提示和無縫整合的重視可能導致其比一些其他流行的人工智慧圖像生成模型更高的計算需求。圖像質量、功能豐富性和計算成本之間的權衡是人工智慧模型開發中的一個常見因素。GPT-4o 似乎優先考慮了增強的功能,導致需要更強大的 GPU 基礎架構來大規模支持其圖像生成功能。
5. 發布後對 GPU 需求的即時影響:短缺、限制和市場反應
為了應對壓倒性的需求和 GPU 資源的壓力,OpenAI 迅速對 ChatGPT 的圖像生成功能實施了臨時速率限制,適用於所有用戶 13。免費方案用戶面臨更嚴格的限制,最初存取有所延遲,隨後每天最多只能生成三張圖像 3。付費訂閱者(Plus、Pro、Team、Select)可能也經歷了某種形式的速率限制,儘管具體細節並未總是詳細說明 17。這些限制的迅速實施突顯了 GPT-4o 的圖像生成對 OpenAI 基礎架構的直接和嚴重影響,迫使他們優先考慮系統穩定性而不是無限使用。新功能的意外大規模用戶參與迅速超過了 OpenAI 最初的容量預測,因此需要立即採取措施以防止系統故障並確保所有用戶的基本服務水平。分級限制反映了平衡不同用戶群體需求的嘗試。
OpenAI 執行長山姆·阿爾特曼在社交媒體平台 X(前身為 Twitter)上公開發表聲明,他幽默地指出他們的「GPU 快要熔化了」,這為潛在的基礎架構挑戰提供了一個坦誠且廣為流傳的承認 13。他還提到計劃暫時引入速率限制,同時公司致力於提高效率,並表示希望這些限制不會持續太久 17。阿爾特曼的透明度使公眾廣泛關注到 GPU 資源在為先進人工智慧應用提供動力方面的關鍵作用,以及大規模擴展此類服務以滿足巨大用戶需求所面臨的挑戰。透過公開談論 GPU 短缺問題,阿爾特曼管理了用戶的期望,並為實施的限制提供了背景資訊。這也突顯了像 GPT-4o 這樣尖端人工智慧模型所需的巨大計算能力。
雖然許多用戶對 GPT-4o 的圖像生成功能表達了興奮和熱情,但速率限制的實施,尤其是對於免費用戶而言,可能導致了一些沮喪和失望 18。這些限制可能暫時抑制了用戶充分探索該功能並將其整合到工作流程中的程度,從而可能影響初始的採用和使用率。平衡用戶熱情與基礎架構限制的需求對 OpenAI 來說是一個挑戰,他們需要維持用戶滿意度並促進該功能的長期採用。雖然 GPT-4o 圖像生成的新穎性和強大功能不可否認,但使用限制可能會給用戶帶來不便。OpenAI 需要仔細管理這些限制,並清晰地溝通其持續時間以及公司提高容量的努力。
在 GPT-4o 發布後,OpenAI 經歷的廣泛報導的 GPU 短缺問題進一步強化了現有的敘述,即由於人工智慧技術的快速發展和採用,對高性能計算硬體的需求不斷增加 17。這一事件可能為投資者和行業分析師提供了另一個數據點,突顯了 GPU 製造商的關鍵重要性以及人工智慧領域持續的供應鏈動態。OpenAI 的經驗突顯了支持具有圖像生成等計算密集型功能的先進人工智慧模型的大規模部署所需的巨大基礎架構投資,進一步驗證了 GPU 市場的強勁增長預測。像 OpenAI 這樣領先的人工智慧公司因用戶需求而面臨 GPU 限制的真實案例,為行業分析師預測的市場趨勢提供了切實的證據,加強了人工智慧硬體和基礎架構公司的投資論點。
6. GPU 市場的長期影響:先進人工智慧圖像生成的作用
以 GPT-4o 為例,日益普及和精密的先進人工智慧圖像生成技術預計將成為高性能 GPU 持續長期需求的重要驅動因素 21。更廣泛的人工智慧市場,其中 GPU 在訓練和推理中都發揮著至關重要的作用,預計在未來幾年將實現顯著增長,而人工智慧圖像生成是這個生態系統中的一個關鍵應用 22。先進的人工智慧圖像生成並非小眾應用,而是與大型語言模型和機器學習等其他高要求的 AI 工作負載一起,成為 GPU 市場整體增長軌跡的重要貢獻者。隨著人工智慧模型變得更加複雜,能夠生成更高分辨率、更精細細節和更強風格控制的圖像,計算需求將繼續升級,從而需要越來越強大的 GPU 硬體。這些技術在各個行業和消費者應用中的日益普及將進一步擴大這種需求。
由包括圖像生成在內的人工智慧應用所驅動的 GPU 強勁需求,正成為 GPU 製造業創新和競爭的主要催化劑 22。雖然 NVIDIA 目前在數據中心 GPU 領域佔據主導地位,但像 AMD 這樣的公司正在取得進展,並且出現了具有專用人工智慧晶片架構(NPU、TPU)的新參與者 22。對更高效、更強大且更具成本效益的人工智慧加速器的需求將繼續推動該領域的研究和開發 22。人工智慧圖像生成領域的進步正在促進半導體行業的動態和競爭格局,從而促進最終將有益於人工智慧技術性能和可訪問性的創新。人工智慧領域的高風險和巨大的市場潛力正在激勵公司大力投資開發尖端的 GPU 和人工智慧專用硬體。這種競爭可能會導致更快的技術進步,並為利用人工智慧圖像生成的用戶和企業提供更廣泛的選擇。
對開發更高效的人工智慧模型和優化技術的持續研究,從長遠來看可能會減緩 GPU 需求的極度增長 37。創建能夠以更少的參數和更低的計算需求實現相當甚至更高圖像質量的模型,可能會減輕 GPU 資源的一些壓力 41。人工智慧模型效率的突破可能導致未來先進的圖像生成不太依賴於龐大的 GPU 集群,從而可能使其在更廣泛的硬體上更易於訪問。隨著與訓練和運行大型人工智慧模型相關的能源消耗和成本變得越來越重要,開發更高效的演算法和架構的動力也越來越強。這一領域的成功可能會對人工智慧圖像生成的長期可持續性和可訪問性產生深遠的影響。
雲端運算平台在提供訓練和運行大規模人工智慧圖像生成模型所需的龐大計算資源(包括 GPU)方面發揮著至關重要的作用 22。雲端 GPU 實例的可用性和成本將繼續成為影響企業和個人用戶人工智慧圖像生成服務可訪問性和可負擔性的關鍵因素。人工智慧圖像生成的增長與雲端 GPU 基礎架構的發展和擴展密切相關,因為許多用戶和應用程式將依賴這些平台來滿足其計算需求。雲端供應商正在不斷投資擴大其 GPU 容量,以滿足人工智慧領域不斷增長的需求。雲端供應商之間的競爭可能會導致更具競爭力的價格和更廣泛的 GPU 選項,從而進一步促進人工智慧圖像生成技術的採用。
7. 比較分析:GPT-4o 與其他人工智慧圖像生成模型在吉卜力風格生成和 GPU 使用方面的比較
由 OpenAI 開發的 DALL-E 3 是先前整合到 ChatGPT 中的圖像生成模型 3。雖然 GPT-4o 被認為是具有增強功能的升級版,但 DALL-E 3 也能夠透過適當的文本提示生成吉卜力風格的圖像 6。DALL-E 3 的 GPU 需求可能低於 GPT-4o,使其對基礎架構的要求可能較低。它可以透過 ChatGPT Plus 和 API 存取 27。
Stable Diffusion 是一種流行的開源人工智慧圖像生成模型,以其高度的客製化和眾多微調模型的可用性而聞名,包括專門用於生成吉卜力風格圖像的模型(例如,Ghibli Diffusion、Studio Ghibli Style)9。Stable Diffusion 的一個顯著優勢是它可以在具有足夠 VRAM(通常建議 8GB 或更多)的消費級 GPU 上本地運行,為個人用戶提供對生成過程的更直接控制和可能更低的成本。性能可能因特定模型和硬體而異 23。
Midjourney 是一種透過 Discord 存取的高度評價的人工智慧圖像生成服務。它以產生美觀且藝術性的結果而聞名,包括令人印象深刻的動漫和類似吉卜力的風格,尤其是透過其專用的「Niji」模型 9。Midjourney 在其自身的伺服器基礎架構上運行,因此用戶無需擁有專用的 GPU。計算資源由 Midjourney 管理,這使得具有不同硬體水平的用戶都可以存取 9。
表 1:吉卜力風格人工智慧圖像生成模型比較與 GPU 使用情況
功能/模型 | GPT-4o | DALL-E 3 | Stable Diffusion (吉卜力模型) | Midjourney (Niji 模型) |
開發者 | OpenAI | OpenAI | Stability AI & 社群 | Midjourney |
整合 | ChatGPT 內建 | ChatGPT 內建 | 可在本地或透過各種平台運行 | 透過 Discord 運行 |
吉卜力風格 | 使用「吉卜力風格」提示非常有效,風格轉換出色 | 使用「吉卜力風格」提示有效 | 專門微調的模型擅長生成吉卜力風格 | 專用的「Niji」模型產生高品質的動漫和類似吉卜力的藝術 |
易用性 | 非常容易,對話式介面 | 非常容易,整合在 ChatGPT 中 | 中等,本地設置可能需要技術,在平台上更容易 | 中等,需要熟悉 Discord 命令 |
GPU 使用情況 | 高,導致 OpenAI 的 GPU 過載 | 中等,可能低於 GPT-4o | 各不相同,可以在消費級 GPU 上運行(建議 8GB+ VRAM) | 伺服器端,無需本地 GPU |
客製化 | 良好,透過詳細的提示和迭代優化 | 良好,透過詳細的提示和長寬比控制 | 非常高,提供眾多參數、模型和 LoRA | 良好,透過提示工程和參數調整 |
可存取性 | 需要 ChatGPT Plus/Pro/Team 訂閱才能完全存取,有限的免費存取 | 需要 ChatGPT Plus/Pro/Team 訂閱才能完全存取,有限的免費存取 | 基礎模型免費,微調模型和平台使用需付費 | 基於訂閱 |
8. 專家對人工智慧圖像生成和 GPU 需求未來發展軌跡的看法
專家預計人工智慧圖像生成模型在品質、真實感和藝術控制方面將持續快速發展 1。未來的模型有望更好地理解複雜的提示,生成更高分辨率、更精細細節的圖像,並為用戶提供更直觀的方式來引導創作過程 1。人工智慧圖像生成技術仍處於早期階段,具有巨大的未來發展潛力。擴散模型、生成對抗網路(GAN)和 Transformer 架構等領域的持續研究和開發可能會在圖像生成能力方面帶來重大突破。
人工智慧圖像生成預計將越來越多地整合到廣泛的應用和專業工作流程中,包括行銷、廣告、內容創作、設計、教育和娛樂 1。正如 GPT-4o 所見,在 ChatGPT 等平台中進行原生整合,預示著人工智慧圖像生成將成為日常數位互動的無縫組成部分 1。人工智慧圖像生成日益增長的實用性和可訪問性將推動其在各個領域的採用,進一步刺激對底層技術的需求。隨著人工智慧圖像生成工具變得更加用戶友好,並能夠為特定用例產生高質量的結果,企業和個人將越來越多地將其納入他們的創意和溝通流程中。
專家普遍認為,在可預見的未來,對高性能計算資源(尤其是 GPU)的需求將持續增長,這主要是由於包括圖像生成在內的人工智慧模型日益複雜和強大 21。訓練和運行這些先進模型的計算密集性需要 GPU 提供的強大並行處理能力 21。人工智慧圖像生成領域的進步是 GPU 市場長期增長前景的重要貢獻者,並且需求可能保持強勁。隨著人工智慧模型不斷突破圖像生成能力的極限,計算需求將繼續升級,確保 NVIDIA 及其競爭對手的高性能 GPU 擁有強勁且持續的需求。
儘管預計 GPU 需求將保持高位,但專家也預計人工智慧模型效率的提高和更專業硬體(如 NPU 和 TPU)的開發可能會在長期內減輕 GPU 資源的一些壓力 22。研究人員正在積極探索新的架構和優化技術,以創建更有效率的人工智慧模型 37。未來在人工智慧演算法和硬體方面的創新可能會為人工智慧圖像生成帶來更平衡和可持續的生態系統,從而可能降低某些任務對高端 GPU 的極度依賴。與大規模 GPU 使用相關的經濟和環境成本正在推動對更有效率的人工智慧計算解決方案的研究。針對特定任務(如圖像生成)量身定制的專用人工智慧硬體的開發,與通用 GPU 相比,可能會提供性能優勢並可能降低某些工作負載的功耗。
9. 結論:綜合分析與展望
GPT-4o 及其整合的圖像生成功能的發布引發了廣泛的興趣和病毒式傳播的趨勢,尤其是在生成吉卜力風格圖像方面,這展示了該模型增強的功能和易用性。這項功能的巨大受歡迎程度立即對 OpenAI 的 GPU 資源造成了巨大的壓力,正如執行長山姆·阿爾特曼的評論和臨時實施的速率限制所證明的那樣,這突顯了先進人工智慧圖像生成的計算密集性。GPT-4o 引發的趨勢,以及人工智慧圖像生成領域更廣泛的進步,預計將成為高性能 GPU 持續增長需求的主要驅動力,從而促進半導體行業的創新和競爭。雖然 GPT-4o 提供了一個引人注目且整合的解決方案,但其他模型(如 DALL-E 3、Stable Diffusion 和 Midjourney)也為吉卜力風格的圖像生成提供了強大的功能,每種模型在可訪問性、客製化和 GPU 使用方面都有其自身的優勢。人工智慧圖像生成的未來充滿希望,將出現更精密的模型,更廣泛地整合到各種應用中,並且對計算能力的需求將持續強勁。雖然模型效率和專用硬體的進步可能會出現,但 GPU 仍可能是在推動人工智慧驅動視覺創意發展方面的一個關鍵組成部分。隨著這項快速發展的技術變得越來越普及,其倫理和社會影響也需要仔細考慮。
MP500系列微型電腦:移除預設 sudo 使用者one,新增自訂 sudo 使用者
MP500系列微型電腦:移除預設 sudo 使用者one,新增自訂 sudo 使用者
MP500系列微型電腦預設一sudo使用者one,預設密碼是1234。root預設密碼也是1234。如果想要刪除預設的 sudo 使用者one,並新增一個專屬自己的 sudo 使用者。本篇將示範如何透過終端機簡單完成這個任務。
步驟一:啟動終端機或遠端透過SSH登入MP500系列微型電腦
在本地GNOME桌面啟動GNOME終端機,
或透過 SSH 登入MP500電腦:
ssh one@mp500_host_ip
步驟二:新增新使用者
新增一個名為 myname
的新使用者,並設定密碼:
sudo adduser myname
輸入密碼後,會要求你提供一些個人資料,完成後按下 Enter 即可。
步驟三:將新使用者加入 sudo 群組
使用下列命令將 myname
加入 sudo 群組,使其能夠執行管理員指令:
sudo usermod -aG sudo myname
確認使用者是否加入成功:
groups myname
步驟四:登出並使用新帳號登入
登出現有帳號後,重新登入伺服器使用新帳號 myname
。
測試 sudo 權限是否設定成功:
sudo apt update
步驟五:刪除原有使用者
確認新帳號可正常使用 sudo 後,即可刪除舊使用者 one
。
若想連同使用者主目錄一併刪除,請執行:
sudo deluser --remove-home one
如只想刪除使用者保留其主目錄資料,則執行:
sudo deluser one
注意事項
- 執行刪除操作前務必確認新使用者帳號已成功擁有 sudo 權限。
- 刪除帳號操作可能會造成資料遺失,建議備份重要資料後再執行。
透過以上簡單步驟,就能輕鬆管理 MP500系列微型電腦上的 sudo 使用者設定,讓系統管理更加安全且有效率。
修改 MP500系列微型電腦的 root 預設密碼
步驟 1:在終端機中使用 passwd 命令
直接透過 passwd 命令進行變更:
sudo passwd root
步驟 2:修改 root 密碼
系統將提示你輸入並確認新的 root 密碼:
New password:
Retype new password:
完成密碼輸入後,會顯示如下訊息:
passwd: password updated successfully
步驟 3:驗證 root 密碼修改成功
你可以透過以下方式登入 root 帳號來驗證:
su -
輸入你剛才設定的新密碼後,如果順利進入 root 權限,代表密碼修改成功。
注意事項:
- 務必妥善保管並牢記 root 密碼。
- root 帳號擁有最高權限,建議謹慎使用,平時仍以一般 sudo 帳號操作系統較安全。
DeepSeek 發布後對 NVIDIA 的影響全面分析
技術影響:對 GPU 依賴性的改變
DeepSeek 的新技術展現了以更低硬體成本達到接近最先進 AI 模型性能的可能性。這家中國新創使用約2,048片規格較落後的 NVIDIA GPU(如受美國限制性能的 H800/A100),在兩個月內訓練出參數高達 6710 億 的大型模型 DeepSeek-V3。其總訓練耗時約 280 萬 GPU-小時,成本僅約 560 萬美元(按每小時每卡 $2 美元計)約 3,000 萬 GPU-小時(約為 DeepSeek V3 的 10 倍計算量)。令人矚目的是,Llama 3 使用了更多資源但效果未見得比 DeepSeek-V3 更好。DeepSeek 官方聲稱,其最新模型在推理和推算能力上媲美 OpenAI 和 Meta 最先進的模型,但訓練成本只是其一小部分。
為達成「小硬體、大效能」的突破,DeepSeek 研發團隊採用了多項尖端優化技術:
- 專家混合(Mixture-of-Experts, MoE)架構:將巨型神經網路拆分為多個小型「專家」子網路,各自專精不同任務。模型在每次推理時只啟用與當前輸出相關的一小部分參數(僅使用6710億參數中的一小組)。這大幅減少了訓練和推理所需的計算量。
- 長上下文優化:針對大型語言模型長上下文記憶的瓶頸,DeepSeek 開發了**“多頭潛在注意力”**技術,把注意力機制中的關鍵-值向量壓縮存儲。如此降低記憶體占用並提高不同 GPU 之間傳輸效率。
- 低精度計算(量化):採用 8-bit 精度表示部分模型權重,而非傳統的16或32-bit 。這使模型權重佔用的顯存縮減一半,等於每張GPU能容納雙倍參數量,從而以較少的GPU完成原需更多硬體才能達成的訓練任務。
- 集群通訊與併行優化:DeepSeek 深入調校了 2,048 顆 GPU 集群的互聯結構和通信算法,減輕頻寬瓶頸。例如,他們重新配置了 NVIDIA H800 GPU 的部分運算單元(132個SM單元中的20個)專門用於節點間的資料壓縮傳輸,以克服網路連線限制,加速GPU間的資訊交換。同時透過精細的執行緒和資料管線調整,最大化併行效率 。
上述種種創新遠超一般軟體開發對硬體的調校程度,甚至繞過了 NVIDIA 標準軟體棧。DeepSeek 工程師直接使用類彙編級的 PTX 指令進行底層優化,而非典型的 CUDA 函式庫調用。PTX 是介於高階語言(如CUDA C++)和機器碼間的中介層,能對暫存器配置、執行緒/執行緒束(warp)級別進行細粒度控制。DeepSeek 透過 PTX 做出許多 CUDA 無法實現的調優,例如劃分硬體資源執行壓縮/解壓任務和排程更高效的執行緒併發 。這種極致優化難度極高,維護成本大,也顯示 DeepSeek 工程團隊具備非凡實力 。全球 GPU 供應緊張和美國出口管制的外在壓力,反而促使 DeepSeek 走上軟硬體協同創新的道路,達成降低硬體依賴的突破。
從AI 計算架構角度看,DeepSeek 的成果可能帶來幾點重要影響:
- 降低最新昂貴 GPU 的絕對必要性:DeepSeek-R1/V3 證明,即使不依賴當前最頂級的 NVIDIA H100 GPU,只要充分挖掘現有硬體(如前代 A100/H800)的潛力,也能達到最先進模型水準。這意味過去被視為限制的硬體瓶頸,可以部分透過演算法和軟體優化來彌補。未來研發人員可能更關注提升計算效率,而非一味追求增加硬體規模。
- AI 模型研發「成本門檻」下降:DeepSeek V3 模型據報只花費 $560 萬美元訓練完成 。一份華爾街分析指出,DeepSeek 的解決方案相較競爭對手效率高出約45倍 。下圖顯示了一些主要模型的性能與成本對比,其中 DeepSeek V3 和 R1(紅點)以遠低於 GPT-4、Claude 3.5 等模型的推理成本達到同等甚至更高的性能。這種性能/成本比的大幅提升,暗示開發最先進 AI 所需的資本投入可能下降,許多中小型公司或研究機構也能參與競爭,減少對少數幾個擁有大量GPU資源巨頭的依賴。

DeepSeek 模型在性能與成本上的表現遠優於許多西方對手:圖中縱軸為模型在 MMLU 基準上的分數(越高越好),橫軸為 API 計算成本(對數刻度)。DeepSeek-R1(紅點)達到約 93 分性能,但每百萬字元輸入成本僅約$0.1,美國的 GPT-4.0(藍點)成本高約一個數量級。低成本高效能的模型問世使市場質疑是否有必要繼續大規模增購昂貴 GPU 硬體。

- AI 計算架構從「堆硬體」轉向「軟硬體協同優化」:DeepSeek 並未提出全新品類的計算芯片,核心仍是 GPU,但透過軟體創新讓現有架構煥發新生。這提醒業界未來打造 AI 基礎設施時,應更重視 架構優化 和 算法創新,如模型稀疏化、記憶體優化、分佈式計算高效通信等,而非僅依賴摩爾定律提供更強的硬體。換言之,現有資料中心的 GPU 叢集可以經過更聰明的排程和軟體調整來提升利用率,而非線性地增加設備。
- 對推理階段硬體需求的影響:DeepSeek-R1 模型對外宣稱在一些任務上的使用成本比 OpenAI 同類模型低 20–50 倍 。如果事實確然,意味著企業用戶在部署AI應用(推理服務)時,可能不需要像以往那樣配備大量最新GPU,就能以較低成本滿足性能要求。特別是 R1 這類“長推理”模型可以在推理過程中自主生成中間“思考鏈”(thought tokens)來逐步解題 ,有效提升質詢答案的正確率和複雜任務解決能力。然而此類「推理型AI」需要消耗比傳統一次性推理多得多的算力。NVIDIA 執行長黃仁勳指出,讓模型「多想幾步」,每次查詢所需的計算量可能是以前的百倍。因此,雖然單次推理成本下降,推理使用總量可能因更複雜的應用而大幅增加 。未來資料中心的計算重心可能從訓練轉向推理,即便 DeepSeek 技術降低了訓練對頂級GPU的依賴,整體對GPU運算的需求依舊可能繼續攀升——只是需求將來自於不同的使用型態(如模型微調、增強推理等。因此,NVIDIA GPU 在 AI 基礎設施中的角色不會減弱,只是不再僅著眼於大模型訓練,而是廣泛應用在推理加速、定制化訓練等環節。
綜上,DeepSeek 展現的技術趨勢是提高每顆 GPU 的有效產出,減少為提升性能而無限擴充硬體的必要。這可能緩解企業對最新 NVIDIA GPU 的絕對依賴,但不代表 NVIDIA 硬體會被棄用——相反,這些突破多半仍是在 NVIDIA 架構上實現的,只是方法論上更為高效。未來 AI 計算架構將更強調軟硬體結合的整體效率,NVIDIA 也需要因應這種趨勢,提供更高性價比和更靈活的加速方案,以保持技術領先。
市場與財務影響:GPU 需求與訂單展望
DeepSeek R1 的發布在資本市場引發了明顯震盪,投資者擔憂 NVIDIA 賴以高速成長的 AI GPU 需求前景可能生變。NVIDIA 股價在消息傳出後大幅下挫,單日市值蒸發一度高達 5900 億美元,創美股史上最大單日市值損失紀錄。雖隨後股價有所反彈,但幾天內累計仍跌去約 9%(約數百億美元市值)。不僅 NVIDIA,一眾 AI 晶片股都受此拖累下跌,足見市場對未來GPU需求放緩的擔憂相當普遍。下表列出當週 NVIDIA 股價的劇烈波動:週一暴跌,週二反彈大半,週三又回落,反映投資人心態的反覆。
造成恐慌的核心原因在於:DeepSeek 以廉價硬體達成高階 AI 的事實,動搖了華爾街對 NVIDIA GPU *「需求永續增長」*的信心。過去兩年,全球超大規模雲端(如 AWS、Azure、Google)為了AI訓練投入了數十億美元,添置了無數 NVIDIA A100/H100 等GPU,加速中心的建設。這些資本開支背後的假設是:更大的模型需要更多的GPU,唯有持續購買高階晶片才能保持競爭力。但 DeepSeek R1 的橫空出世提出了一個相反的問題——如果新的AI模型可以用更少或更廉價的硬體訓練,超大廠們是否還需要繼續大舉採購GPU?DeepSeek 官方在社交媒體上宣稱 R1 推理耗費僅為 OpenAI 模型的1/20~1/50 ;另一份投行報告則估計 DeepSeek 模型訓練效率比對手高出45倍 。如此巨大的成本差異讓投資者開始重新評估 NVIDIA GPU 定價權和需求彈性:未來客戶是否會減少對昂貴最新GPU的購買,轉而尋求更經濟的解決方案?
對 NVIDIA 而言,其主要客戶群的採購動向至關重要。其中包括雲服務商(如亞馬遜 AWS、微軟 Azure、Google Cloud)和科技巨頭(如Meta、OpenAI等)。這些公司既是 NVIDIA 數據中心級 GPU 最大的買家,也是最有能力實現 DeepSeek 式創新的團隊。DeepSeek 的突破可能使他們調整AI基礎設施投資計劃:
- 延長現有 GPU 的使用周期:許多雲端巨頭已經擁有龐大的 GPU 集群。例如Meta在2023年前後建置了超過 60 萬顆 GPU 的運算池。如果透過軟體優化能進一步榨取這些既有資源的潛力,企業可能推遲升級換代的時間表,減少對新一代 NVIDIA GPU 即時採購的需求。VanEck 的行業分析指出,各家雲廠目前更關注的是如何善用既有的AI基礎設施創造收益,而不是無止境擴張硬體規模。AI模型發展趨勢也顯示,無限擴大參數規模的邊際效益遞減,業界正從「比拼模型大小」轉向提升模型效率與商業應用 。因此,短期內 NVIDIA 可能面臨部分大客戶放緩新增訂單、改以優化現有機器為主的局面 。
- 尋找替代計算方案:DeepSeek 的成功給了其他公司一個信號:在 NVIDIA GPU 之外亦有可行之路。這可能激勵雲服務商加大對自研AI晶片的投入(例如 Google TPU、Amazon Trainium 等),以降低長期對NVIDIA的依賴。事實上,早在 DeepSeek 出現之前,一些巨頭已經布局自有AI加速器來控制成本。DeepSeek 事件可能強化這種趨勢,使企業在採購 NVIDIA 產品時更加精打細算,或者以競品(如 AMD、Intel 新推出的GPU/加速器)作為議價籌碼。尤其在中國市場,美國的晶片管制推動了本土AI晶片研發熱潮。如果中國科技公司受激勵加快自給自足,NVIDIA 在這一龐大市場的未來訂單恐面臨下滑風險。
- 價格與預算壓力:當前 NVIDIA 的高階 GPU(如 H100)價格昂貴且供貨吃緊,如果客戶相信透過軟體優化和開源模型就能以較低規格硬體達到目標,他們對高價購買最新GPU的意願可能下降。這不一定表現為立刻取消訂單,而更可能是在新的資本開支決策上變得保守。投資者據此擔心 NVIDIA 未來數季的銷售增長動能趨緩——這從股價反應已略知一二 。例如,有券商分析提醒,DeepSeek 所宣稱的$560萬訓練成本並未計入全部研發投入,實際花費可能高得多;但即便如此,相比動輒數億美金的大模型項目,仍顯著便宜。這將迫使潛在買家重新審視AI 訓練的投資回報,進而影響對 NVIDIA 硬體的採購規模。
儘管市場一度風聲鶴唳,但也需注意長期需求的另一面:低成本的 AI 模型可能催生新的應用增長,反而帶來更多元化的硬體需求。UBS 等機構指出,DeepSeek 的出現並未動搖 AI 整體成長趨勢,因為 AI 並非零和遊戲。更高效的模型降低了應用門檻,預期AI 部署會更加普及,最終仍會擴大對算力的總需求,只是由不同類型的產品來滿足。事實上,在 DeepSeek 事件後,美國科技巨頭並未削減AI投入:Meta 宣布將在 2025 年投入 600~650 億美元擴充 AI 基礎設施,GPU 規模計畫擴大一倍,達到 130 萬顆之譜。這意味即便一部分模型訓練更省硬體,整體上大公司仍選擇繼續砸錢確保 AI 領先。對 NVIDIA 而言,短期股價雖受挫,但其訂單能見度可能仍維持高位——特別是來自願意不惜重金佈局AI的客戶(例如 Meta、OpenAI/Microsoft 等),仍將帶來可觀的 GPU 需求。
綜合來看,DeepSeek 讓市場重新審視了 AI 算力供需的平衡:NVIDIA 超高速增長預期受到挑戰,投資者開始考量競爭與需求彈性,但同時 AI 熱潮並未降溫,只是正朝著更經濟高效的方向演進。NVIDIA 未來的業績走向,將取決於它能否在這種新平衡下持續説服客戶——購買它的新產品仍是最具價值的選擇,而不僅僅依靠軟體優化或替代方案。
競爭環境:自研晶片潮與 DeepSeek 優劣勢分析
DeepSeek 的崛起發出了明確信號:AI 硬體與架構領域的競爭將進一步加劇。長久以來,NVIDIA 在AI加速領域幾乎處於壟斷地位,但如今各路玩家看到繞開NVIDIA技術路線的可能性,預計會加大投入,打造屬於自己的AI解決方案。這種競爭態勢主要體現在兩個層面:
- 硬體研發競爭加劇:DeepSeek 的成功雖然是在 NVIDIA GPU 上實現,但它證明了高效演算法可部分替代硬體性能提升。這可能激勵更多公司發展專用AI晶片(ASIC)或加速器,優化特定AI工作負載,進一步降低對通用GPU的需求。事實上,AI 硬體市場近年已湧現多元化趨勢:在模型推理階段,許多專用ASIC、小型GPU晶片甚至高性能CPU都能勝任部分工作,對 NVIDIA 高端GPU形成補充乃至競爭。例如,谷歌的TPU在雲端推理上提供高性價比,亞馬遜的Trainium專用晶片針對訓練任務推出,Tesla自研Dojo晶片加速自動駕駛訓練等。DeepSeek 刺激下,這類自研潮可能更旺盛:每個超大廠都不想在核心AI能力上受制於人。長遠看,NVIDIA 將面對一個更加「群雄並起」的競爭環境——不僅有傳統GPU對手 AMD、習慣CPU領域的 Intel,還有眾多初創和垂直巨頭自帶的ASIC/FPGA方案。在中國,DeepSeek 更被視為突破美國晶片封鎖的樣板。可以預見,中國政府和企業會投入更多資源發展本土AI芯片和大型集群方案,減輕對NVIDIA進口貨的需求,這對 NVIDIA 的市場版圖是一大潛在威脅。
- 軟體開源與模型生態競爭:DeepSeek V3/R1 採取的是開放權重策略(Open-Weight Models)。這與 OpenAI 封閉GPT-4形成對比。在矽谷和AI研究界,越來越多聲音支持開源模型,讓社群共同改進。DeepSeek 的成功為開源超大模型正名,說明即使缺乏最新硬體,透過開源協作也能誕生一流模型 。這可能促使更多企業加入開源模型開發,與 NVIDIA 深度綁定的封閉生態分庭抗禮。開源模型普及後,使用者可以在本地或自有伺服器上運行AI,而不一定依賴商業雲端服務——間接減少了對提供這些雲服務所需GPU基礎設施的需求增量。對 NVIDIA 而言,這種「軟體民主化」意味其未來的成長不僅取決於硬體性能,還取決於能否融入並支持蓬勃發展的開源AI生態。值得注意的是,DeepSeek 雖強調開源,但其高效實現仍依賴高度定制的軟硬體結合,非一般公司能輕易複製。因此在短期內,DeepSeek 的影響主要還是心理層面——讓產業看到另類途徑可能可行。但從長期來看,它改變了賽局的敘事,各競爭者勢必加速追趕以免落後。
DeepSeek vs. NVIDIA(Blackwell 架構):深入比較 DeepSeek 技術和 NVIDIA 現有/未來技術,可以看到雙方各有優劣:
- DeepSeek 的競爭優勢:成本與效率是其最大殺手鐧。DeepSeek-R1 模型在不少基準測試上可與 GPT-4、Claude 3.5 等媲美,但推理成本低一個數量級。訓練上更是以幾百萬美元完成了傳統上需要幾千萬乃至上億美元的任務。對許多預算有限的AI應用者來說,這種平價高能的模型極具吸引力。此外,DeepSeek R1 著重「推理能力」,允許用戶查看模型解題時的“思考過程”,在透明度和可解釋性上領先一步。這種創新功能是OpenAI封閉模型無法提供的,也贏得了不少技術社群的好評。可以說,DeepSeek 作為後起之秀,在模式上更開放,在性能/成本上更具破壞性,給傳統AI巨頭造成明顯壓力。
- DeepSeek 的局限性:儘管聲勢驚人,DeepSeek 並非沒有弱點。首先,它本質上仍依賴 NVIDIA GPU 作為算力基礎(宣稱使用的是中國特供版H800等)。它並沒有改寫底層硬體規則,而是在現有硬體上優化。因此,DeepSeek 並未直接顛覆 NVIDIA 的技術路線——甚至可以說,DeepSeek 的突破建立在 NVIDIA 硬體之上。其次,DeepSeek 為達效率極致投入了巨大研發努力(如PTX級別編程),這種成果難以複製 。其他競爭者想達到同樣水準,可能也需投入巨資和長時間的人才培養。短期內,DeepSeek 模型本身對 NVIDIA 銷售的替代效應有限——事實上,有傳言稱 DeepSeek 私下可能擁有大量未披露的 H100 晶片資源以支撐其業務,若屬實反而意味 NVIDIA 依然從中受益。此外,DeepSeek 作為一家新創,生態體系和商業服務能力與 NVIDIA 尚不可同日而語。NVIDIA 經營多年,已建立完善的軟體開發套件(CUDA、生態庫等)和客戶支持體系;反觀 DeepSeek,目前主要提供模型而非完整解決方案,在服務大型企業客戶上經驗不足,模型的安全性和可靠性也遭到一些質疑(例如有報告指出 R1 存在易被誘導生成有害內容的漏洞)。因此 DeepSeek 雖在技術上引人注目,但商業成熟度仍需時間驗證。
- NVIDIA(Blackwell 架構)的應對:面對這一挑戰,NVIDIA 最新一代 Blackwell GPU 架構被認為是其反擊的關鍵。黃仁勳強調 Blackwell 是為「這個時刻」設計的——也就是說,它針對當前 AI 模型的新趨勢(如長推理鏈、模型微調、大規模部署)做了優化。Blackwell 採用了高速互連技術,把多顆GPU緊密相連,使大模型推理的速度比現有架構快25倍。這直接對準了 DeepSeek 等模型注重的長程推理/思考過程,提供更強硬體支援。此外,Blackwell 強調一個平台涵蓋預訓練、微調和推理各階段 。這意味未來客戶不需另行尋找特殊解決方案,在 NVIDIA 平台上就能高效地完成訓練後的各種操作(如強化學習、知識蒸餾、鏈式推理等)。NVIDIA 也持續強化軟體優勢,例如針對 MoE 等模型類型推出更完善的庫支持,針對低精度運算在新硬體上提供原生的Transformer Engine(H100 已引入FP8支援)等,減少客戶自行優化的負擔。歸根結底,NVIDIA 的優勢在於綜合實力:頂尖的硬體設計、成熟的軟體生態、與企業客戶的深厚關係。DeepSeek 的出現將迫使 NVIDIA 在價格和性能效率上做出讓步或改進,但 NVIDIA 手中亦有籌碼(如Blackwell的技術飛躍)來維持領先。可以預見兩者將形成性能效率競賽:一方追求更高效算法減少硬體需求,另一方則提升硬體性能來降低單位算力成本。
總的來說,DeepSeek 雖撼動了 NVIDIA 的地位,但短期內很難動搖 NVIDIA 在高端AI加速器市場的主導。真正值得關注的是它引發的連鎖反應——各大公司加速自研、產業更加多元化。NVIDIA 正面臨它在 AI 時代以來最嚴峻也最刺激的競爭局面:不再是一枝獨秀,而是百家爭鳴。未來 NVIDIA 能否保持高成長,取決於其持續創新能力以及在新競爭環境下調整策略的靈活度。
長期影響:NVIDIA 的未來戰略與應對
DeepSeek 引發的技術變革,對 NVIDIA 的長遠策略帶來深刻啟示。展望未來,NVIDIA 業務模式和產品佈局可能出現以下演變,以積極應對新的行業格局:
- 產品策略:從「極致性能」轉向「性能/效率綜合體」。過去 NVIDIA 推出新GPU往往以大幅提升峰值算力為賣點,而未來將更加注重提高效率與通用性。黃仁勳提出「AI 工廠」的概念,認為未來的資料中心主要服務於AI模型的訓練與部署。為此,NVIDIA 將提供一體化的平台,使客戶能以單一架構完成從訓練到推理的全部工作。Blackwell 架構正是朝這方向邁進,它著重於訓練後的微調和推理階段的擴展性,以滿足“讓模型多思考”的需求。長期而言,NVIDIA 可能針對不同應用場景推出更細分的產品線:例如,為大規模推理部署提供性價比更優的加速卡,為需要本地處理的邊緣設備提供功耗更低的AI晶片。這種調整已初見端倪——NVIDIA 除了數據中心GPU,近年也佈局了汽車自動駕駛晶片、機器人模組等。因此,未來 NVIDIA 不僅是高性能計算提供者,更將成為全方位AI基礎設施供應商,產品覆蓋從雲端到邊緣的各類需求。
- 軟體與生態:強化易用性與開放性。DeepSeek 的案例表明,軟體效率提升具有巨大價值。NVIDIA 已經深諳此道,長期投入CUDA生態。今後他們可能更進一步,比如將 DeepSeek 採用的某些優化(如MoE路由、記憶體壓縮、8-bit訓練等)整合到官方軟體庫和硬體特性中,降低開發者使用高效算法的門檻。事實上,H100 GPU 引入的Transformer Engine就是為了自動處理混合精度運算,未來 Blackwell 或後續架構或許會增加專門的單元來加速Mixture-of-Experts等模型。NVIDIA 也可能釋出更多開源工具,擴大開發者社群,防止人才和生態向非 NVIDIA 平台流失。同時,隨著開源模型興起,NVIDIA 需確保這些模型在其硬體上運行得最優最快,從而在開源浪潮中依然扮演關鍵角色。換言之,NVIDIA 將更加擁抱開放生態,提供軟體即服務的增值,讓客戶即使不購買最新硬體也能透過 NVIDIA 的軟體獲益,培養長期黏著度。
- 商業模式:從賣硬體向「硬體+服務」轉型。儘管硬體銷售仍是營收大頭,但 NVIDIA 已釋放出進軍服務的信號,例如推出 DGX Cloud(租用GPU算力服務)、與主要雲廠合作提供 AI 即服務方案等。DeepSeek 類似事件促使 NVIDIA 考慮新的收益來源:如果未來硬體需求增速放緩,提供整體解決方案和雲端服務可以補足。NVIDIA 有能力將其頂級硬體組建成AI超算平台,出租給有需要的客戶,這樣即便硬體銷量減少,仍可通過服務訂閱獲利。同時,NVIDIA 或許會探索授權IP或與第三方芯片合作的模式,在一些市場收取技術授權費,而非直接銷售晶片,以適應潛在的市場區隔(例如因地緣政治無法直接供貨的地區)。總體來說,NVIDIA 長遠可能發展出「硬體銷售+軟體訂閱+雲服務」三位一體的商業模式,增強抵禦市場波動的能力。
- 市場戰略:平衡高端與大眾市場。DeepSeek 顯示了平價AI的威力,NVIDIA 未來或需在高端之外兼顧中低端市場。這可能意味著調整定價策略或推出平價版本產品,防止競爭者從低端蠶食市場。例如,NVIDIA 早前推出的中國限定版 A800/H800,就是在性能受限情況下爭取市場的方法。同理,如果競爭加劇,NVIDIA 或許會適度下調旗艦產品價格或加快新品迭代,以量取勝,鞏固市占。另外,NVIDIA 也將繼續深耕關鍵客戶關係,尤其是雲服務巨頭和大型AI實驗室,提供定制合作(如協助他們建設超大規模集群、優化軟硬體)來綁定需求,防止其完全轉向自研。黃仁勳在最近財報溝通中特別強調「推理時代」的來臨和 NVIDIA GPU 不可或缺的地位。這其實是在向投資者與客戶雙向傳遞信心:即便訓練需求放緩,推理部署會帶來更大機會,而 NVIDIA 已做好準備。
總結而言,DeepSeek 帶來的衝擊短期令 NVIDIA 承受壓力,但長期可能成為 NVIDIA 蛻變的契機。NVIDIA 一方面將加速技術創新(如推出更契合新型模型的 Blackwell GPU),另一方面會調整市場打法以適應新環境。對 NVIDIA 這樣的平台型公司而言,最終勝負取決於能否繼續引領AI計算的方向:既提供無與倫比的性能,也提供靈活高效的解決方案。在AI需求依舊旺盛的大趨勢下,“變”與“不變”將交織塑造 NVIDIA 的未來。不變的是對算力極限的追求,改變的是實現方式——從純堆砌硬體轉向軟硬並進、服務拓展。只要 NVIDIA 能順勢而為,深耕其生態優勢並擁抱效率革命,它仍有望在群雄逐鹿的AI時代維持領先地位,繼續扮演關鍵的算力提供者角色。
參考資料
- VanEck博客:《DeepSeek’s Disruption: The Impact on Nvidia and the Semiconductor Industry》 (DeepSeek’s Disruption: The Impact on Nvidia and the Semiconductor Industry | VanEck) (DeepSeek’s Disruption: The Impact on Nvidia and the Semiconductor Industry | VanEck) (DeepSeek’s Disruption: The Impact on Nvidia and the Semiconductor Industry | VanEck)
- Understanding AI 專欄:《I don’t believe DeepSeek crashed Nvidia’s stock》 (I don’t believe DeepSeek crashed Nvidia’s stock) (I don’t believe DeepSeek crashed Nvidia’s stock) (I don’t believe DeepSeek crashed Nvidia’s stock) (I don’t believe DeepSeek crashed Nvidia’s stock)
- Reuters 專稿:《What is DeepSeek and why is it disrupting the AI sector?》 (What is DeepSeek and why is it disrupting the AI sector? | Reuters) (What is DeepSeek and why is it disrupting the AI sector? | Reuters) (What is DeepSeek and why is it disrupting the AI sector? | Reuters)
- Tom’s Hardware 新聞:《DeepSeek’s AI breakthrough bypasses industry-standard CUDA…》 (DeepSeek’s AI breakthrough bypasses industry-standard CUDA for some functions, uses Nvidia’s assembly-like PTX programming instead | Tom’s Hardware) (DeepSeek’s AI breakthrough bypasses industry-standard CUDA for some functions, uses Nvidia’s assembly-like PTX programming instead | Tom’s Hardware) (DeepSeek’s AI breakthrough bypasses industry-standard CUDA for some functions, uses Nvidia’s assembly-like PTX programming instead | Tom’s Hardware)
- BankInfoSecurity 報導:《Nvidia’s Huang: DeepSeek Fuels Explosion in AI Compute Needs》 (Nvidia’s Huang: DeepSeek Fuels Explosion in AI Compute Needs) (Nvidia’s Huang: DeepSeek Fuels Explosion in AI Compute Needs) (Nvidia’s Huang: DeepSeek Fuels Explosion in AI Compute Needs)
- U.S. Global Investors 專欄:《China’s AI Breakthrough Sends NVIDIA Reeling…》 (China’s AI Breakthrough Sends NVIDIA Reeling and Sparks National Security Fears – USGI) (China’s AI Breakthrough Sends NVIDIA Reeling and Sparks National Security Fears – USGI)
NVIDIA 2024第四季度財報電話會議分析
財務表現
- 營收與獲利:2025財年第四季度(Q4)營收達 393億美元,年增 78%,淨利 220億美元,年增 80%,雙雙超越市場預期 。全年營收累計 1,305億美元(年增114%),淨利 728.8億美元(年增145%)。
- 毛利率與費用:Q4 毛利率為 73%,略低於市場預期的73.5% ,較去年同期下滑約3個百分點,主因是最新資料中心晶片生產成本較高。同時營運費用年增48%,主要用於增加員工人力及薪酬。毛利率走低趨勢也反映在未來展望中,預計下季度將進一步降至 70.6% 。
- 業務構成:資料中心業務依然是成長引擎。Q4 資料中心收入 356億美元,年增 93%,高於分析師預期的341億 。強勁的生成式AI需求帶動該部門營收佔比創新高,全年資料中心收入翻倍至 1,152億美元。相較之下,遊戲部門本季營收 25億美元,年減 11%(季減22%),低於市場預期的30.2億,主要受限於高階GPU供應吃緊 。不過整年度遊戲業務仍小幅成長9%至114億美元。專業視覺化(工作站繪圖)Q4收入5.11億美元,年增10%,汽車部門全年收入約21億美元,預計新財年將升至 50億美元 。
- 財測與成長:管理層對未來維持樂觀。公司預計2026財年第一季度營收約 430億美元(上下浮動2%),略高於市場預期的420億 。這意味著年增約65%,儘管增速低於去年同期高達262%的爆發性成長,但在如此高基數下仍屬亮眼 。同時管理層表示隨著供應好轉,資料中心和遊戲業務在下季度將雙雙實現環比增長 。
市場影響
- 股價表現:財報公布後,NVIDIA股價在盤後交易上揚約2% 。儘管本次財測優於預期的幅度不如先前幾季(中位數指引高出華爾街預期約11億美元,相較之前常見的超出20億),但投資者對新產品供應進展感到安心——Blackwell晶片產能提升快於預期,消除了市場對轉產瓶頸的擔憂。財務長Colette Kress在電話會議中特別提到,公司正「迅速擴大供應」,僅第四季Blackwell系列就貢獻了110億美元營收。這一關鍵訊息被視為股價上揚的主因。
- 投資者情緒:整體而言,投資者和分析師對於NVIDIA的AI前景依然樂觀。在財報發布前,就有券商上調目標價,例如KeyBanc分析師將目標價從180美元調高至190美元,理由是NVIDIA Blackwell B200 晶片供應量超出預期。華爾街預計未來幾季超大科技公司將大舉增加AI資本支出——據估計2024年超大規模資料中心資本支出將年增40%,達 3,000億美元——這意味著對NVIDIA硬體的需求持續強勁 。此外,多家機構在財報後維持「增持」評級,認為短期毛利壓力無礙長期成長趨勢。
- 市場趨勢影響:今年初中國公司推出高效AI模型「DeepSeek」,以更少GPU實現媲美美國大型模型的效果,一度引發市場對NVIDIA需求放緩的擔憂。然而業界很快指出,這類高效模型在推理階段需要投入更多算力,反而有利於NVIDIA新一代晶片的用武之地。事實上,Blackwell等GPU針對推理階段的Test-Time Scaling優化,可利用額外算力提升模型推理精度,被視為符合這股新趨勢。再加上大型科技公司隨後公布的空前AI預算,市場對晶片需求的擔心獲得紓解。總體而言,NVIDIA依然是AI浪潮下的核心受益者,市值在財報後穩居全球前幾大公司之列。
產品與技術更新
- 遊戲與繪圖產品:本季NVIDIA推出了新一代消費級GPU——GeForce RTX 50系列桌機與筆電顯卡。這系列基於全新的Blackwell架構,配備第五代Tensor Core與第四代光追核心(RT Core),AI運算能力高達3,400 TOPS。實際性能較上代躍升2倍,並引入大量AI驅動的繪圖技術,包括神經網路著色、數位人生成、先進幾何與光影效果等。新的DLSS 4技術透過AI插幀將畫面幀率提升最高8倍(將1個渲染幀變成3個),大幅增進遊戲與創作應用的流暢度。NVIDIA並推出多款搭載Blackwell GPU的筆記型電腦,採用全新Max-Q省電技術,續航力提升達40%,預計3月起由各大OEM廠商上市。這些產品融合了AI與圖形處理,重新定義了視覺運算體驗。
- 資料中心與AI晶片:在雲端與數據中心領域,Hopper架構的H100/H200 GPU持續暢銷,同時新世代Blackwell資料中心GPU已開始放量。NVIDIA表示第四季單季交付了約110億美元的Blackwell產品,以滿足雲端巨頭對AI算力激增的需求。值得注意的是,Blackwell早期量產曾遭遇挑戰——晶片在GPU互連電路上存在設計缺陷,導致良率偏低,且在高密度機架中出現散熱過熱問題。幸而在台積電協助下,設計缺陷已修復。CEO黃仁勳坦言這些「小問題」曾讓公司損失幾個月進度,但NVIDIA已「以光速」恢復生產並順利大規模量產出貨。他強調Blackwell晶片「各方面表現都很非凡」,首個季度即實現了數十億美元銷售。這顯示NVIDIA成功克服技術瓶頸,將業界最先進的AI晶片大規模推向市場。
- 新產品佈局:NVIDIA也預告了下一波產品計劃。Blackwell Ultra(代號B300系列)作為下一代旗艦AI晶片,預計於今年下半年推出。根據會議透露,Blackwell Ultra將在現有架構上大幅提升規格,尤其是推理性能、顯存和能效方面。它將配備 288GB 的HBM3E高頻寬記憶體(較現行B200的192GB提升50%),頻寬達 1792 GB/s,單卡功耗高達 1400W,並採用先進散熱技術以應對更高熱密度。儘管規模驚人,黃仁勳表示由於新晶片與Blackwell架構一致,從Blackwell過渡到Ultra將比先前從Hopper過渡容易得多,預期會相當順利。他形容NVIDIA的產品研發如同「下一班列車」按年度節奏推進,意味著公司將持續以每年一代的速度迭代GPU技術。除了Ultra,黃仁勳也提及一項名為Vera Rubin的新計畫,有望在即將到來的GTC大會上揭曉。據悉,Vera Rubin將專注於客製化ASIC和特殊用途GPU,對應更廣泛的AI推理和“實體AI”應用場景。這暗示NVIDIA正積極布局從雲端到邊緣、從虛擬到實體各領域的AI計算產品線。
- 軟體與生態系統:技術更新不僅體現在硬體,NVIDIA的軟體生態同樣是優勢。會中強調了Transformer變壓器模型首次以即時方式應用於圖形領域;同時,NVIDIA的軟體堆疊(CUDA、AI框架、驅動)持續優化,以充分發揮新GPU的性能。黃仁勳指出,AI技術正跨行業融入主流程,每個學生、每家金融公司都將以AI助力。為此,NVIDIA提供從雲端到端端的完整解決方案——例如,與思科合作將Spectrum-X乙太網交換技術整合進企業AI基礎架構 ,以及與HPE合作推出全球首款 Grace CPU+Blackwell GPU 超級系統(HPE的GB200 NVL72)。同時,Azure、Google、AWS、Oracle等雲服務商成為首批部署Blackwell系統的夥伴,在全球資料中心引入NVIDIA最新GPU以滿足客戶激增的AI算力需求 。這種軟硬體一體的生態布局,使NVIDIA的AI平台滲透從公有雲、私有雲到邊緣裝置,進一步鞏固了技術領先地位。
競爭環境
- 與AMD的對比:在資料中心AI晶片市場,NVIDIA持續遙遙領先對手。AMD雖然近年也積極投入GPU加速器並取得成長,但體量仍遠小於NVIDIA。2024年AMD資料中心業務收入創下 126億美元新高(年增94%),其中約 50億來自Instinct AI加速卡。相比之下,NVIDIA相同期間資料中心收入高達 1,152億美元,規模是AMD的數倍。AMD寄望於最新MI300系列整合CPU/GPU加速器在超級計算和雲端取得突破,CEO蘇姿丰甚至預期未來幾年AI晶片年營收可達「數百億美元」級別 。實際上,AMD第四季資料中心營收同比大增69%至3.86億美元,但仍低於市場預期的41.4億。雖然AMD在某些高性能計算專案中嶄露頭角(如El Capitan超級電腦採用43,808顆MI300A),並贏得了Meta使用MI300X來部署大型語言模型的嘗試,但在主流生成式AI訓練推理市場,NVIDIA憑藉硬體性能和軟體生態雙重優勢,短期內難以撼動。CUDA軟體平台的廣泛採用、開發者社群和成熟的AI解決方案,使許多客戶即便有AMD替代方案,依然傾向選擇NVIDIA的完整平台。
- 與Intel的對比:在資料中心CPU領域,Intel長期主導但正面臨夾擊。AMD的EPYC伺服器處理器在2024年Q4一度實現對Intel的銷售超越 ,表明Intel的市場份額被蠶食。然而在AI硬體方面,Intel自身並未對NVIDIA形成實質威脅。Intel此前推出的Ponte Vecchio GPU和收購而來的Habana Gaudi AI加速器主要在少數雲服務商試用(如AWS提供Gaudi2雲服務),影響力有限。整體而言,Intel資料中心事業正努力轉型,2024年該公司數據中心與AI部門營收下滑,而NVIDIA在AI加速領域幾乎形成事實標準。未來Intel計畫將重心放在其CPU與FPGA融合(透過收購Altera/Xilinx的競爭)以及代工業務,但在GPU加速器生態上與NVIDIA仍有明顯代差。
- 專用晶片與產業趨勢:大型雲端業者和新創公司也在研發自有AI晶片,形成NVIDIA潛在競爭。例如Google的TPU、亞馬遜的Trainium/Inferentia、Tesla的Dojo、Meta的加速器方案,以及中國的寒武紀、華為昇騰等ASIC。但這些特殊應用晶片(ASIC)多針對特定工作負載,且軟體生態相對封閉。業界分析認為,雲服務商自研的客製AI晶片將「與GPU共存」而非完全取代GPU。事實上,不少超大規模數據中心同時部署自研ASIC和NVIDIA GPU,以取長補短:自研晶片在推理某些模型上具備成本優勢,但訓練通用AI模型以及廣泛的第三方AI應用仍仰賴NVIDIA完善的軟硬體支持。NVIDIA也順勢推出開放加速軟體(如CUDA-X、Omniverse)和客製產品(如為中國市場提供符合規範的H20 GPU)來留住客戶。例如,針對美國出口管制,NVIDIA推出性能略低於H100的H20晶片滿足中國客戶需求,在一些本地模型如DeepSeek上表現不俗,近期訂單顯著成長。雖然受限於規管,中國市場營收仍遠低於管制前水準,且預計將維持在目前比例,但NVIDIA藉由產品調整,成功在限制中尋求商機,這也是競爭策略的一環。
- 挑戰與機遇:未來NVIDIA面臨的競爭挑戰包括:一是供應鏈與產能(如何確保台積電先進製程和先進封裝的產能優先供應)。目前傳出NVIDIA已包下台積電超過七成的CoWoS先進封裝產能,這意味著競爭對手想在尖端製程上追趕,將受制於產能取得。二是技術路線(模型演算法進步可能降低硬體需求增速)。然而NVIDIA正順勢而為,強化晶片在模型後處理、推理階段的表現,以迎接AI應用從「訓練導向」轉為「推理導向」的新趨勢。同時,公司積極投入研發,每年高達數百億美元的研發預算為其建立起技術護城河。黃仁勳將AI晶片比作軟體,預期未來將無所不在,滲透每個產業與角落 。隨著人工智慧持續高速發展,NVIDIA只要維持產品迭代節奏和生態系經營,在可見的將來仍將在競爭中處於有利地位。
管理層展望與策略
- 供應與產能策略:管理層在電話會議上反覆強調「供應提升」的重要性。經歷了Blackwell初期的產能瓶頸後,公司正大幅增加產出以滿足訂單需求。這包括與晶圓代工與封裝合作夥伴(如台積電、矽品等)緊密協調,以及提前預訂產能以確保供應鏈穩定。黃仁勳指出,NVIDIA正「迅速擴大供應」來縮短客戶等待時間,這將支持未來數季的營收成長。此外,公司現金流充裕,具備進一步擴產和進行策略投資的能力,同時也繼續進行庫藏股回購等資本配置(截至Q4已回購近110億美元股票,以回饋股東)。
- 技術研發與產品路線:從管理層談話可窺見NVIDIA清晰的產品演進路線圖。黃仁勳以「火車時刻表」比喻產品迭代,表示公司將維持每年推出新架構/升級產品的節奏。2025年下半年推出Blackwell Ultra、後續還有Vera Rubin等專案,顯示未來2~3年產品藍圖已排定。在研發方向上,公司將資源聚焦於加速計算(包括GPU計算、DPU網路加速、CPU協同計算)、人工智慧(特別是生成式AI、自主智能體Agent、機器人等領域),以及軟體生態(如AI模型開發平台、數位孿生/Omniverse等)。這從即將舉辦的GTC開發者大會關鍵字「Agent、機器人、加速計算」可見一斑。管理層相信,透過持續的技術領先和完整的平台方案,公司能引領下一波AI浪潮。正如黃仁勳在新聞稿中所言:「隨著自主智能體AI和物理AI的發展,AI正以光速推進,為下一波AI革命奠定基礎」。
- 市場拓展與客戶策略:未來NVIDIA將在守住雲端超大戶的同時,積極開拓企業級客戶和垂直行業市場。CFO在會中提到,資料中心業務中來自企業客戶的營收今年幾近翻倍,顯示除了雲服務商外,一般企業對AI基礎設施的需求正快速升溫。NVIDIA計畫透過完整的軟硬體方案(如DGX雲服務、AI超級計算集群、企業AI軟體套件)來降低企業採用AI的門檻。同時,在汽車自動駕駛領域,公司預期本年度車用業務營收將達 50億美元 。這意味著像Drive Orin、Drive Thor這類車載AI晶片將大規模出貨,NVIDIA在智慧駕駛與邊緣AI推論市場也將有所斬獲。管理層強調各行各業都在擁抱AI,例如醫療、製造、金融服務等領域開始導入生成式AI與數位孿生技術,NVIDIA看好自身平台在這些新興應用上的機會。
- CEO關鍵發言:黃仁勳在電話會議中多次針對AI未來發展發表見解,折射出NVIDIA的長期策略。他將AI晶片類比軟體,認為未來計算平台的價值在於可程式化和通用性,NVIDIA的GPU將如同軟體般無處不在。他預見生成式AI和自主Agent將徹底改變各種軟體和服務,每個人都能利用AI提升生產力。這也解釋了公司為何投入巨資打造雲端AI計算中心,並與教育機構合作培訓AI人才。黃仁勳還談到全球市場:面對地緣政治風險,他強調遵守規範並服務好各區域客戶的重要性(如透過H20等產品滿足中國合規需求。總的來看,他的發言釋放出對AI產業長期繁榮的樂觀態度,也凸顯NVIDIA將以技術創新和生態系統構建來保持領先。
結論
NVIDIA本次第四季度財報與電話會議充分展現了公司在AI時代的領導地位:財務上,營收與獲利遠超高成長基期,資料中心業務爆發式增長;市場上,即便增速放緩趨於正常化,投資人仍對其前景充滿信心。產品技術方面,新一代GPU問世與未來路線圖清晰穩健,軟硬體生態持續拓展。競爭環境中,儘管AMD、Intel及各類ASIC虎視眈眈,NVIDIA憑藉研發實力、供應鏈掌控和軟體優勢築起高牆。管理層前瞻性的策略和對AI趨勢的深刻理解,為公司未來增長奠定了基礎。在AI浪潮方興未艾之際,NVIDIA交出了一份高含金量的答卷,也為下一財年描繪了持續高歌猛進的圖景。
深入介紹許成鋼《制度基因》:核心觀點、背景與影響
Prompt:請寫一篇5000字有關許成鋼 (Chenggang Xu) 著 “制度基因 (Institutional Genes)” 的介紹。
Deep Research:
好的,我將為您撰寫一篇5000字的文章,全面介紹許成鋼的著作《制度基因(Institutional Genes)》。
這篇文章將涵蓋以下五個方面:
- 書籍的主要內容與核心觀點
- 許成鋼的背景與學術貢獻
- 書中的關鍵案例或理論解釋
- 與其他學者或書籍的比較
- 這本書的影響與評價
文章將以繁體中文撰寫,完成後我會通知您。
深入介紹許成鋼《制度基因》:核心觀點、背景與影響
書籍主要內容與核心觀點
《制度基因──中國制度與極權主義制度的起源》是經濟學家許成鋼的一部鉅作,透過一個創新的理論框架「制度基因」來剖析中國政治經濟制度的歷史源流 (臺大出版中心)。許成鋼的核心觀點是:當代中國的政治與經濟體系儘管經歷了數十年的改革開放,實質上仍然屬於極權主義體制,而這種體制之所以能夠持續至今,與其深層的歷史結構有密切關聯 (臺大出版中心)。他提出,中國共產極權體制的形成來自兩股「制度基因」的結合——一方面是源自蘇聯的共產極權主義制度基因,另一方面是中國自身傳統帝制的制度基因 (臺大出版中心)。這些制度基因可以理解為不斷自我複製並決定制度演變的基本要素,可被經驗證據所識別 (臺大出版中心)。許成鋼強調,如果不理解中國深植於歷史的「極權制度基因」,就無法真正了解當前中國體制的運作邏輯 (臺大出版中心)。
透過「制度基因」概念,許成鋼重新審視中西方制度演化的分野。他首先分析了共產主義意識形態在歐洲的興起,以及俄國在自身傳統制度基因基礎上如何孕育出極權主義政權 (臺大出版中心)。在此基礎上,他詳述了中國傳統帝制制度的特徵,闡明中國歷史上對個人自由與產權的嚴格限制如何構成了一套獨特的制度基因 (臺大出版中心) (臺大出版中心)。當蘇聯共產國際將布爾什維克式的極權主義輸入中國時,這兩種基因相互融合,讓中國共產黨得以建立起有中國特色且持久的極權主義統治 (臺大出版中心)。許成鋼指出,中共統治模式的最終基礎是暴力,歷史上中國在中共治下頻繁的政治鬥爭證明了這一點;例如,文化大革命等運動展現出權力鬥爭和鎮壓在維繫體制中的核心作用 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。因此,習近平時代所出現的集權強化、私營企業受打壓、國家資本主義回潮等現象,都並非偶然的「突變」,而是中國深層制度結構使然 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。從制度基因的視角看來,近年來中國政治的倒退(如取消國家主席任期制、強化意識形態控制等)只是延續了過往區域管理式極權主義的深層邏輯,而非僅僅由領導人個人造成的一時現象 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。
許成鋼的論證對一些長久以來的誤判提供了釐清。例如,過去三十年不少觀點認為中國經濟的市場化發展必然帶來政治體制的開放,然而許成鋼以歷史制度分析指出這種「經濟繁榮必然催生民主」的預期是錯誤的 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。他強調中國的深層制度基因決定了經濟改革可以在不觸動政治基因的前提下推進,使中國能一度出現經濟高速成長卻依然維持一黨極權統治的獨特現象 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank) (臺大出版中心)。總而言之,《制度基因》一書的核心觀點在於,以「制度基因」為分析工具,深度解讀中國極權主義體制的歷史成因,說明當代中國的政治經濟走向是其長期制度演化的結果,而非外界所想像的改革挫折或領導人偏離正軌的偶然 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank) (臺大出版中心)。
許成鋼的背景與學術貢獻
了解《制度基因》的作者許成鋼本人的背景,有助於理解他何以提出如此觀點深刻的著作。許成鋼出生於1950年,成長於北京一個知識分子家庭。他的父親許良英是中國知名的科學史學家,在1957年反右運動中被打成右派,母親也受到株連遭到政治迫害 (許成鋼 – 維基百科,自由的百科全書)。少年時期的許成鋼親身經歷了文革動亂:1966年文化大革命爆發時,他還是清華附中的學生,目睹了共產主義理想與現實之間的巨大反差,對「無產階級專政」下持續不斷的階級鬥爭產生強烈質疑 (許成鋼 – 維基百科,自由的百科全書)。他曾下鄉到黑龍江農場勞動兩年,一邊勞動一邊研讀《資本論》,試圖從理論上理解社會主義制度的問題 (許成鋼 – 維基百科,自由的百科全書)。由於在文革期間與友人討論對現行體制的看法,1970年初他被以「反革命」罪名關押勞改,直到文革結束後才平反 (許成鋼 – 維基百科,自由的百科全書)。這段親身經歷,使許成鋼對極權制度有了切身體悟,也奠定了他日後研究中國制度問題的強烈動機。
改革開放後,許成鋼走上正規的學術之路。他先在清華大學獲得碩士學位,1984年前往美國留學,1991年獲得哈佛大學經濟學博士學位 (許成鋼 – 維基百科,自由的百科全書)。作為經濟學者,他的職業生涯相當卓越:先後任教於倫敦政治經濟學院(LSE)和香港大學經濟系擔任講座教授,現職是史丹佛大學「中國經濟與制度研究中心」的高級研究員,同時也是美國科斯研究所(RCI)理事、歐洲經濟政策研究中心(CEPR)研究員 (許成鋼 – 維基百科,自由的百科全書) (許成鋼 – 維基百科,自由的百科全書)。許成鋼在學術研究上的貢獻廣受肯定,曾獲得中國經濟學界極具聲望的孫冶方經濟學論文獎(2013年)以及首屆中國經濟學獎(2016年) (許成鋼 – 維基百科,自由的百科全書)。這些榮譽顯示他在經濟學尤其是中國經濟制度研究領域的領先地位。
在研究領域方面,許成鋼專長於政治經濟學與制度經濟學,對中國政治和經濟制度的運行及歷史演變有深入分析 (許成鋼 – 維基百科,自由的百科全書)。早在1990年代,他就與合作者提出「地方政府競爭理論」,解釋中國經濟改革為何能取得有別於蘇聯的成功 (許成鋼 – 維基百科,自由的百科全書)。該理論強調中國在中央集權的威權體制下,透過地方分權和地方官員間的經濟績效競爭,形成一種激勵機制來推動增長。2011年,許成鋼將這套思想發展為“分權式威權體制”(Regionally Decentralized Authoritarianism, RDA)的理論框架,系統闡述中國制度如何透過區域分權競爭來促進改革與發展 (許成鋼 – 維基百科,自由的百科全書)。他進一步在2016年的中國經濟學獎獲獎演講中指出,隨著中國面臨嚴重的社會穩定問題、貧富差距和環境惡化等挑戰,傳統的以GDP增長為單一目標的地方競爭機制已經失效,中國亟須朝憲政方向改革 (許成鋼 – 維基百科,自由的百科全書)。這些研究顯示,許成鋼早已關注中國體制內在結構對經濟表現和改革前景的深遠影響。事實上,他撰寫過有關中國經濟奇蹟背後制度基礎的經典論文,其對中國改革時代制度因素的闡釋在學界產生廣泛影響 (臺大出版中心)。
此外,許成鋼的學術視野十分廣博,涉獵法律與金融、數字經濟等領域。例如,他曾提出「不完備法律」的概念,為分析司法制度對經濟的影響提供了新的框架 (许成钢: 思想是在跨制度比较中产生的 – 清华大学经济管理学院)。這反映出他善於將制度經濟學的視角延伸到不同主題。然而,貫穿其學術生涯的一條主線,是對中國政治經濟體制及其變革的持續探索。在哈佛求學時,他師從著名經濟學家雅諾什·科爾奈(János Kornai) (許成鋼回憶導師科爾奈:學者最重要的貢獻是出思想,而不是出論文)——科爾奈以研究社會主義經濟短缺問題與體制特徵著稱,這也深深影響了許成鋼對計劃經濟和極權體制的思考 (許成鋼回憶導師科爾奈:學者最重要的貢獻是出思想,而不是出論文)。可以說,許成鋼結合了自身在極權體制下的生活經驗與西方嚴謹的學術訓練,孕育出對中國制度問題獨到而深入的見解。這些背景和積累最終促成了《制度基因》一書的誕生——作為他對中國制度與極權主義起源多年研究的集大成之作 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。
書中關鍵案例與理論解釋
《制度基因》內容宏富,涵蓋歷史上和現實中的多個關鍵案例,並通過這些案例來闡釋作者的理論主張。首先在理論方面,書中明確提出並闡釋了「制度基因」這一關鍵概念。許成鋼將制度基因定義為決定制度演化的基本單元,它們能自我複製並長期延續 (臺大出版中心)。他關注的重點是社會中關於產權、人權以及政治決策權的制度安排如何在歷史長河中變遷 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。透過制度基因的分析框架,許成鋼得以回答一個大哉問:為何近代以來中國與西方在制度演進上出現巨大分歧,未能產生憲政民主的基因 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。書中將這一理論運用到中西對照上:例如作者對比了西方自古羅馬以降憲政秩序的發展與中國歷史上的政治結構,指出中國傳統缺乏約束專制權力的制度基礎,導致日後無法自然轉型出保障個人自由與權利的憲政體制 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。
在歷史案例方面,本書深入探討了幾個對中國制度影響深遠的時期和事件。中國傳統帝制時代是首要的分析對象之一。許成鋼追溯中華帝國的制度起源與演變,詳細審視了例如科舉制度與郡縣制度等傳統體制的影響 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。科舉考試和中央集權的行政架構塑造了中國幾千年的官僚體系和政治文化,強化了國家對社會的滲透能力,同時也壓制了地方自治和個人自主的生長空間 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。這些傳統制度基因使中國即使在帝制晚期(如明清時代),依然維持高度專制的皇權統治 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。有學者如余英時先生曾指出,中共政權實際上是明清以降皇權專制與現代極權主義的結合體。然而余英時主要從思想文化角度切入,而許成鋼的獨特之處在於,他立基於現代制度和社會科學的分析,更具體地指出了傳統制度在組織結構上的影響 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。例如,他剖析科舉與儒家思想如何培育出順從權威的政治文化,並結合了對沙俄及蘇聯布爾什維克體制的比較研究,凸顯中國共產政權的歷史根源 (臺大出版中心) (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。
蘇聯共產極權制度則是另一個關鍵環節。許成鋼在書中花了大幅篇章分析蘇聯共產黨從革命走向史達林極權的過程 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。他認為俄國自身的傳統制度基因(例如沙皇專制和農奴制遺緒)為布爾什維克建立極權體制提供了肥沃土壤 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。蘇共在奪取政權後,透過一黨專政、秘密警察、大清洗等手段,構築了全面控制社會的制度框架。這些從蘇聯產生的極權制度基因,後來由共產國際傳入中國,被中國共產黨加以學習和移植 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。書中詳細描述了中共早期如何在蘇聯顧問的指導下,按照布爾什維克模式改造自己的組織和統治方式,例如建立嚴密的黨委系統和政治保衛機器,以期復制蘇聯式的極權統治。這一歷史考察清晰地標示出中共極權主義的外來成分,使讀者理解中國極權制度並非全然本土自生,而是傳統與移植雙重作用的結果 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。
除了歷史起源,許成鋼也討論了中共建政後的重大制度變遷。例如,他重點分析了**「大躍進」和「文化大革命」**這兩段極端時期的制度變化 (許成鋼 – 維基百科,自由的百科全書)。在大躍進(1958-1960)中,中國試圖以人民公社化和超高速的工業化來實現烏托邦式的經濟飛躍,結果導致大饑荒。許成鋼透過制度基因視角解讀大躍進期間的政策狂熱和組織模式,指出其實踐反映了極權體制試圖在中國土壤上進行激進複製時遇到的結構性問題 (許成鋼 – 維基百科,自由的百科全書)。而文化大革命(1966-1976)作為另一次極端實驗,則充分展現了極權制度的內在不穩定:為了鞏固個人權力,毛澤東發動群眾鬥爭來摧毀既有的黨政體系和社會秩序,結果造成全國性的混亂和倒退。許成鋼分析道,文革的瘋狂年代雖然表面上削弱了中共的統治機器,但長遠看卻促成中共重新思考如何更有效維繫統治,避免體制再次陷入失控 (許成鋼 – 維基百科,自由的百科全書)。這為日後的制度調整埋下伏筆。
最引人關注的,是許成鋼提出的**「區域管理式極權主義制度」的概念 (許成鋼 – 維基百科,自由的百科全書)。他說明,在文革結束後的鄧小平改革時代,中國共產黨在保留一黨專政的前提下,對統治機制做出了一些調整,形成了一種新的體制模型。這種模型可以被視為傳統中國區域治理模式**(中央-地方的縱向權力結構)與蘇聯式極權政體相融合的產物 (許成鋼 – 維基百科,自由的百科全書)。具體而言,改革開放以來中國實行了經濟領域的分權——允許各地區在經濟發展上有相對自主權和競爭激勵,但同時政治上依舊嚴格維護黨的集中統一領導。許成鋼指出,這種區域管理式的威權體制一方面產生了令人矚目的經濟奇蹟:地方競爭帶來活力,市場要素被引入,經濟快速增長,使中國成功避免了像蘇聯那樣因經濟崩潰而政權垮臺 (臺大出版中心)。另一方面,經濟成功鞏固了共產黨的統治,使中國成為極權主義的超級大國,並沒有朝民主轉型 (臺大出版中心)。許成鋼強調,正是因為制度基因的延續與調適,中國共產黨不僅在改革中倖存下來,還尋找到利用經濟發展來強化統治正當性的途徑 (臺大出版中心) (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。然而,這套模式本身也埋藏隱憂。許成鋼在書中提出,當前中國經濟的高速成長正面臨難以持續的瓶頸,因為缺乏對人權和財產權的制度保障,過去依賴地方競爭刺激增長的方式已走到極限 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。例如,近年政府對民營科技企業(如電子商務、網路產業)的打壓、地方債務激增、產能過剩等現象,都顯示區域管理式極權體制下的增長模式日漸失靈 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。因此,書中通過案例分析不僅回顧了中國制度演變的歷史,也引出了對中國未來走向的理論思考:若不改變深層的制度基因,中國經濟與社會發展將可能陷入停滯或危機。
值得一提的是,許成鋼並未將「基因」視作一成不變的命定論。他在書中澄清,「制度基因」類比的是制度的邏輯或基礎架構,而非不可改變的先天特徵 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。也就是說,雖然中國當前的制度基因決定了極權體制的強韌性,但並非全無改造可能。然而,要改變一個社會的制度基因,絕非透過單一政策或局部改革即可達成,而需要整體性的社會啟蒙和制度重塑 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。許成鋼舉臺灣為例:臺灣的憲政民主並非突然而至,而是植根於其社會自身的歷史條件(例如日治時期現代制度的引入)和戰後私人產權與公民社會的逐步成長,這些構成了不同於中國大陸的制度深層結構,使得臺灣最終能和平轉型為民主政體 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。這樣的比較說明,制度基因並非不可改變,但轉變需要長期的社會積累與努力。通過上述各種案例和理論分析,許成鋼在《制度基因》中提供了一幅貫串古今的宏大圖景,解釋了中國極權制度的起源、演變及其內在機理。
與其他學者或書籍的比較
許成鋼的觀點與不少中外學者的研究形成對話,也在若干方面有所分歧或創新。我們可以從思想史和社會科學兩方面來比較《制度基因》與其他學者的見解。
首先,就中國共產極權體制的歷史根源而言,正如前文所述,歷史學者余英時曾提出中共政權是中國傳統皇權與現代極權主義相結合的產物。余英時強調思想文化的連續性,例如他認為毛澤東的思想極權與明清以來的專制皇權思想一脈相承。然而,許成鋼在《制度基因》中的研究將焦點轉向更具體的制度層面。他不僅指出了傳統思想對中共的影響,更深入分析了制度與組織的連續性,如官僚體系的科層結構、中央集權的治理模型,以及黨對軍隊和社會的滲透控制等 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。這種分析彌補了純思想討論的不足,更明確地描繪出現代中國極權主義的制度深層結構。換言之,相較於余英時偏重觀念史的詮釋,許成鋼運用了現代政治經濟學和制度分析的方法,提供了一種跨歷史階段的制度連續性理解,兩者相輔相成 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。
在西方理論方面,許成鋼的觀點也可與一些知名的政治經濟學說相比較。一本常被提及的著作是阿西莫格魯與羅賓森(Daron Acemoglu & James Robinson)的《國家為何失敗》(Why Nations Fail)。該書強調國家興衰取決於制度是包容性還是汙職(掠奪性)的,並認為歷史上政治權力的分配會影響經濟制度的性質。許成鋼的分析和其有相通之處,即都認為歷史制度因素決定了當代的政治經濟結果。例如,阿西莫格魯等人也曾指出中國的威權體制屬於典型的汙職性制度,雖然帶來經濟增長但缺乏長遠保障。阿西莫格魯本人對《制度基因》一書給予高度評價,指出許成鋼透過歷史和經濟分析揭示了為何中國的迅速崛起並未導致其擁抱民主,原因正是在於深層的「制度基因」,例如帝制傳統對個人自由和財產權的限制 (臺大出版中心)。相較而言,許成鋼更進一步挖掘了中國與蘇聯獨特的結合這一歷史特殊性,而不僅是以包容/汙職的二元分類來概括中國。他強調的「區域管理式極權主義」可以看作對傳統理論的一種細化,說明了在一黨專政的大框架下如何允許局部經濟活力以維持整體體制的存續 (許成鋼 – 維基百科,自由的百科全書)。因此,我們可以說,許成鋼的研究豐富了關於制度決定論的討論,為「中國為何依然威權」這一問題提供了更具歷史深度的答案。
許成鋼也深受經濟學家雅諾什·科爾奈的影響。科爾奈以分析社會主義經濟體制著稱,提出了「經濟短缺」等概念並刻畫了共產國家的體制特徵。許成鋼承襲了科爾奈等制度經濟學派對社會主義的洞見 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。例如,科爾奈強調在社會主義下,軟預算約束和國家對資源的壟斷會導致低效率和短缺。許成鋼在書中討論蘇聯和中國經濟時,也注意到計劃體制下激勵扭曲造成的災難性後果(如大躍進中的饑荒)。但是許成鋼並不止步於經濟效率的問題,他更關注制度如何演化與適應。與科爾奈的著作如《社會主義體制》不同,許成鋼引入了「基因」這一隱喻,試圖刻畫制度在長時段內複製和變異的規律。這讓他的分析具有一種生物演化論的風格:既強調歷史延續性,又允許變遷和突變的可能性。這種風格也讓人聯想到政治學者法蘭西斯·福山(Francis Fukuyama)的國家建設理論。福山在《政治秩序的起源》等書中談到政治制度的演進受文化和歷史路徑制約,並對比如中國早期強國家、弱社會的傳統使其難以生成西方式的問責制。許成鋼的「制度基因」觀點與此頗為相近:他指出中國自秦以降形成的強權國家基因,使其在現代化過程中走上不同於西方的道路 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。但不同的是,許成鋼提供了更聚焦中蘇經驗的微觀機制分析,而非宏觀抽象的理論。可以說,《制度基因》在比較中西政治發展時,兼具了歷史學者的縱深視角和經濟學者的理性分析,這使其在眾多相關著作中別樹一幟。
除了學術理論的比較,許成鋼的觀點也與一些流行的看法形成對照。最明顯的是對**「中國民主轉型」**前景的判斷。許多現代化理論的支持者過去相信,隨著經濟增長和中產階級壯大,中國遲早會走向民主。然而,《制度基因》提供了相反的證據:中國過去幾十年的經驗表明,即使經濟高度繁榮,只要深層制度基因未變,政治結構仍可保持極權而不轉型 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。這點上,許成鋼與政治學者裴敏欣(Minxin Pei)的觀點有相似之處。裴敏欣在其著作《轉型的陷阱》中也論及中國的威權體制具有自我鞏固的傾向,經濟改革可能最終強化而非削弱黨的執政能力。許成鋼則通過歷史比較賦予這一論點更扎實的根據。他進一步挑戰了所謂“北京共識”中對中國模式的樂觀評價。有人將中國的成功歸功於威權政府的優勢治理,但許成鋼提醒讀者,這種成功是建立在特定歷史基因結合下的產物,其代價是對人權和自由的犧牲,且難以長久維持 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。這番見解無疑對習近平時代的政策走向也有針砭意味:當一些人還對中國模式心存幻想時,許成鋼已經點出其中隱含的深層危機。
綜上所述,許成鋼的《制度基因》在學理上承繼並發展了制度決定論和極權主義研究的傳統,與余英時、科爾奈、阿西莫格魯等中外學者的觀點既有契合也有創新突破。它以中國為核心案例,為“歷史如何塑造現實”提供了一個發人深省的說明。在這過程中,許成鋼既吸收了前人關於中國傳統與共產體制的智慧,也對一些流行觀點提出挑戰,從而在中國制度問題的討論上樹立了自己獨特的理論坐標。
《制度基因》的影響與評價
《制度基因》於2024年11月推出中文版(由臺大出版中心出版)後,在華人學術界和政經評論圈引起了強烈迴響 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。此書上市後反響熱烈,不僅銷售表現亮眼、迅速加印,各界還紛紛舉辦多場研討會對其進行討論,顯示出這本著作的重要性和影響力 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。由於書中對中國共產黨極權統治的深刻剖析,在政治立場迥異的讀者中都引發關注:支持民主改革者將其視為理解中共統治本質的指南,而一些關心中國發展前景的溫和建制派也不得不重視其中對經濟與制度未來走向的警訊。
國際學術界對《制度基因》也給予高度評價,多位著名學者撰寫推薦或評論。哈佛大學的經濟學家埃里克·馬斯金(Eric Maskin)稱讚本書「大膽而嚴謹」,透過深刻的歷史和經濟分析,精彩回答了為何中國會走向極權以及中共未來可能如何發展等重大問題 (臺大出版中心)。另一位諾貝爾經濟學獎得主奧利弗·哈特(Oliver Hart)指出,許成鋼在書中引入「制度基因」這一根本因素,成功解釋了西方民主的發展及其在俄羅斯的失敗,讓人們明白為何許多人預期中的中國民主化並未隨經濟崛起而實現 (臺大出版中心)。他稱讚此書是「必讀之作」,尤其適合所有對中國政治走向感興趣的人 (臺大出版中心)。麻省理工學院的經濟學家戴隆·阿西莫格魯(Daron Acemoglu)同樣將《制度基因》視為理解當代中國及其在全球秩序中角色的必讀書,強調許成鋼成功論證了鄧小平改革雖帶來經濟繁榮,但中國政治經濟體系依然保持極權本質 (臺大出版中心)。阿西莫格魯認為,不懂中國極權制度基因,就無法理解今天的中國體系 (臺大出版中心)。這些來自經濟學界頂尖學者的背書,不僅提高了此書的國際能見度,也反映出許成鋼的觀點對學界討論中國問題的價值。
政治學和中國研究領域的專家也對本書表示讚賞。加州大學柏克萊分校經濟學家兼政治學者傑拉德·羅蘭(Gerard Roland)評價《制度基因》為「權威分析」,深入解釋了中國在20世紀未能實現憲政的原因 (臺大出版中心)。他特別提到中國千年的帝制比歐洲的絕對君主制更專制,這種高度專制傳統有助於布爾什維克制度順利移植融合到中國,創造出獨特的極權主義形式 (臺大出版中心)。羅蘭認為許成鋼的歷史和政治經濟分析是傑作,對任何關心中國政治體制的人而言都將成為必讀之作 (臺大出版中心)。普林斯頓大學的中國研究教授林培瑞(Perry Link)則以生動的比喻稱,共產極權體制彷彿是世界上最大的政治生物,其「制度基因」不斷在不同時空重現並發揮關鍵作用 (臺大出版中心)。他讚許成鋼以冷靜理性的態度,深入剖析了這個龐大體制如何運作,而這種冷峻分析正是來自他既身在其中成長又受教於哈佛的雙重經歷 (臺大出版中心)。由此可見,無論從經濟學、政治學還是中國現代史的視角,許成鋼的這部著作都獲得了相當高的評價,被視為理解中國極權主義和制度演化的一部重要作品。
當然,如同任何重要的學術著作,《制度基因》也引發了一些討論與質疑。有人注意到,許成鋼在強調制度激勵結構和暴力基礎時,對於意識形態及民族主義在中共合法性中的作用著墨較少 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。畢竟,中共的統治不僅靠高壓手段,也試圖透過民族復興的敘事來獲取民眾認同。評論者指出,許成鋼聚焦於制度邏輯(激勵相容性)的分析框架,使他對中共透過宣傳營造的正當性基礎關注不足 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。此外,還有觀點提出,中國長期的經濟增長在一定程度上提升了執政者的合法性,這種“績效合法性”也是極權體制得以延續的原因之一,而許成鋼或許低估了它的影響 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。再者,中國的發展離不開國際環境,像外資投入、全球市場以及海外留學生等因素,都對中國的制度變遷產生了作用 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank)。本書以內生的歷史基因為主軸,對這些外部因素討論較少,這也可能是未來討論時補充的方向。然而,整體而言,這些爭議並未否定《制度基因》的價值,反而說明該書成功地把中國制度的討論提升到一個新的高度,使各種不同觀點圍繞著它展開對話。
綜合來看,《制度基因》所帶來的影響是深遠的。它在學術上填補了關於中國極權體制起源研究的一塊拼圖,也為政策分析和未來發展預測提供了一種歷史縱深視角。對於關心中國前途的人而言,許成鋼的觀點發出了警示:如果中國的制度基因沒有根本改變,那麼即便經濟實力再強,政治上的極權屬性仍將伴隨其崛起,並可能在未來成為世界秩序中的一個複雜挑戰 (臺大出版中心) (臺大出版中心)。正如明居正教授在推薦語中所說,許成鋼透過上溯歷史基因,比較中西發展,清楚詮釋了中共治下中國經濟改革的成功與局限 (臺大出版中心)。這本書既是一部嚴謹的學術著作,也不乏對現實的關懷與洞見。它促使讀者反思:中國的未來是否能夠透過社會啟蒙和制度創新來改變其深層基因?抑或這些基因將繼續複製下去,決定中國以及世界的命運?無論答案如何,《制度基因》已然成為理解這些重大問題時不容錯過的參考坐標。它的出版與廣受關注本身,就體現了華人知識界對探索中國制度之謎的不懈努力和高度熱情。 (鄭力軒專欄|從制度的深層結構理解中共──評《制度基因》 – 思想坦克|Voicettank) (臺大出版中心)
利用LibreOffice Draw來局部修改 PDF 文件

LibreOffice Draw 是 LibreOffice 辦公室套件軟體的一部分,它是一款開源的向量圖形編輯器。LibreOffice 是一個自由且開放源碼的辦公室套件,包括文字處理器(Writer)、試算表應用程式(Calc)、多媒體簡報軟體(Impress)、資料庫管理系統(Base)、數學公式編輯器(Math)以及繪圖應用程式(Draw)。
LibreOffice Draw 特別適合處理流程圖、網絡圖、組織結構圖、平面設計和一般圖表繪製。它提供了豐富的繪圖工具和元件,包括線條、形狀、文字、顏色、填充樣式等,使用者可以輕鬆創建簡單到複雜的向量圖形。Draw 的功能強大,足以滿足專業設計師的需求,同時界面友善,也適合初學者使用。
除了基本繪圖和圖形設計功能外,LibreOffice Draw 還支持多頁文檔,可以製作多頁的向量圖案。它還允許輸入和修改PDF文件,這是一個非常有用的功能,讓使用者可以編輯PDF文檔而無需轉換成其他格式。
LibreOffice Draw已預設安裝在MP520-20 Debian Linux微型電腦中,開機即用非常方便。

利用 LibreOffice Draw 編輯 PDF 文檔是一個直接且實用的過程。以下是一個簡單的指南,幫助你開始使用 LibreOffice Draw 來編輯 PDF:
步驟 1: 開啓LibreOffice Draw
- 點選桌面左上角 “概覽”,再點選右下方 “顯示程式” (撥號盤圖示),在螢幕中找到 LibreOffice Draw圖示,點擊圖示啓動程式。

步驟 2: 打開 PDF 文件
- 選擇「文件」選單中的「打開」選項,或者直接將 PDF 文件拖放到 LibreOffice Draw 的窗口中。
- 在打開文件的對話框中,瀏覽到你想要編輯的 PDF 文件,選擇它,然後點擊「打開」。

步驟 3: 編輯 PDF
- 一旦 PDF 文件在 LibreOffice Draw 中打開,你就可以使用各種工具來編輯它。例如:
- 使用「文字工具」(通常在工具箱中)來添加或編輯文字。
- 使用「繪圖工具」來添加形狀、線條或箭頭。
- 利用「選擇工具」來移動、調整大小或旋轉現有的元素。
- LibreOffice Draw 也允許你調整頁面佈局和屬性,如頁邊距和方向。

步驟 4: 儲存或匯出修改後的文件
- 完成編輯後,你可以選擇以 PDF 格式儲存文檔,從而保留你所做的修改。選擇「文件」選單中的「匯出為 PDF」選項,進行適當的設置,然後點擊「匯出」。
- 你也可以選擇另存新檔來保留原始 PDF 文件的未修改版本。
注意事項
- 雖然 LibreOffice Draw 可以處理和編輯 PDF 文件,但對於一些複雜的 PDF 文檔(如含有高級格式、密集圖形或特殊字體的文件),可能無法完美處理。
- 如果 PDF 文檔主要由圖片組成,編輯選項可能會有限,因為 Draw 主要是處理向量圖形和文字。
通過以上步驟,你可以利用 LibreOffice Draw 來編輯 PDF 文件,這對於需要對 PDF 文檔進行快速修改的使用者來說是一個很好的解決方案。