輝達(NVIDIA)執行長黃仁勳(Jensen Huang)所提出的**「三台電腦架構」(The Three-Computer Stack)**,是目前實現「具身智慧」(Embodied AI)最完整的發展藍圖。這個架構解決了機器人從「大腦訓練」到「虛擬演練」再到「實體執行」的核心問題。
這三台電腦的職責與具體實踐方式:
1. 第一台電腦:AI 工廠 (AI Factory)
這台電腦負責「創造大腦」。它是一個超大規模的資料中心,利用海量的數據來訓練機器人的基礎模型(如 Google 的 PaLM-E 或 NVIDIA 的 GR00T)。
具體實踐: 使用 NVIDIA DGX 系統或類似的運算叢集。
任務: * 處理多模態數據(視覺、語言、觸覺)。
訓練基礎模型(Foundation Models),讓機器人理解「拿杯子」是什麼意思,以及如何與人類對話。
Tesla Optimus 的神經網絡就是依靠 Tesla 自家的 Dojo 超級電腦進行大規模視覺訓練。
2. 第二台電腦:Omniverse (數位孿生模擬)
這是最關鍵的一環。機器人不需要在現實世界中摔倒一萬次來學習走路,而是在虛擬世界中進化。這是一個遵守物理定律的數位環境。
具體實踐: 使用 NVIDIA OVX 伺服器運行的 Omniverse / Isaac Gym。
任務:
強化學習(Reinforcement Learning): 在虛擬環境中以百倍速並行訓練數千個機器人化身。
合成數據生成: 當現實數據不足(例如:跌倒、極端環境)時,在虛擬世界生成精確的合成數據。
Figure AI 與 Unitree 等公司,大量使用 Isaac Sim 來測試機器人在複雜地形的平衡能力。
3. 第三台電腦:機器人本體 (Robot Itself)
這台電腦就安裝在機器人體內,負責**「感知與行動」**。它必須在低延遲下處理感測器數據,並即時驅動馬達。
具體實踐: 搭載 NVIDIA Jetson Thor 或是 Tesla 自研的 FSD 晶片。
任務:
推論(Inference): 將第一台電腦訓練好的大腦模型部署進來,即時判斷環境。
避障與路徑規劃: 例如 1X Neo 透過本體運算,實現與人類的安全物理互動。
邊緣運算: 確保即便網路斷線,機器人也能維持基本安全防護。
未來在家庭與老人照護的具體應用
當這三台電腦協作時,我們心目中的家用型機器人(如 Neo Gamma)將能這樣運作:
個人健康監控: 機器人透過「第三台電腦」的視覺感測器,24小時監測長者的步態。如果發現長者走路姿勢異常(可能是中風前兆),會立即發出警報。
精細家務處理: 透過「第一台電腦」學習過的數百萬種物體抓取模型,機器人能精準分辨雞蛋與石頭的抓取力度,協助備餐。
情感陪伴: 結合 Google Gemini 這樣的大語言模型,機器人不只是工具,能理解長者的情緒並進行深度對話。
總結架構表
| 電腦角色 | 核心平台 | 主要目標 |
| AI 工廠 | DGX / 基座模型 | 學習 (Learning) |
| 模擬環境 | Omniverse / Isaac Sim | 進化 (Evolution) |
| 機器人本體 | Jetson Thor / FSD | 執行 (Action) |