根據您提供的來源文件(特別是關於 $\pi_{0.5}$ 模型的論文),Physical Intelligence (PI) 公司的研究實驗雖然沒有在文中直接引用「黃仁勳的三台電腦架構」這一特定名詞,但其技術開發路徑與該架構(AI 工廠訓練、模擬訓練、物理機器人執行)高度契合。以下為基於來源的詳細說明:
1. 合作公司與組織
根據來源文件,Physical Intelligence 的 $\pi_{0.5}$ 模型在開發過程中與以下機構有密切的數據或技術關聯:
- Open X-Embodiment 協作組織: PI 使用了來自此開源項目的海量數據,該協作組織包含 Nvidia (輝達)、Google DeepMind、Microsoft (微軟) 以及多所頂尖學術機構(如 CMU、史丹佛、柏克萊等),。
- Google: $\pi_{0.5}$ 的模型骨幹(Backbone)是基於 Google 開發的 PaliGemma 視覺語言模型(VLM)進行優化與訓練,。
- AgiBot (智元機器人): 論文參考文獻中提到了與 AgiBot 相關的大規模操控平台(Agibot World Colosseo),顯示其在數據與研究交流上有潛在關聯。
2. 機器人硬體設備
在 PI 的移動操控實驗中,使用的是以下硬體架構(如來源中圖 5 所示):
- 雙臂移動操控器 (Mobile Manipulators): 平台配備了兩支 6 自由度 (DoF) 的機械手臂,並裝有平行爪夾具,。
- 底盤與升降機構: 機器人擁有一個全向移動輪式底盤 (Wheeled holonomic base) 以及一個軀幹升降機構 (Torso lift mechanism),。
- 感測系統: 全身配備了 4 個攝影機,包括手腕上的單目 RGB 攝影機、以及面向前方與後方的攝影機,。
- 自由度: 根據平台配置不同,整機的狀態與動作空間總計為 18 到 19 個自由度,。
3. 未來應用場景與軟體潛在客戶
來源文件強調,PI 的目標是實現**「開放世界泛化」(Open-World Generalization)**,讓機器人能離開實驗室進入現實世界執行實務任務,。其軟體未來的應用與客戶群主要集中在:
- 一般家庭環境 (Residential Homes): 論文展示了機器人在陌生家庭中執行清理廚房、整理臥室、鋪床、摺疊衣物及掛毛巾等長時程任務(持續 10 到 15 分鐘)的能力,,。
- 通用服務業與家務自動化: 軟體的核心價值在於其**「開箱即用」的泛化力**,能應對未見過的物件與環境布局,。這意味著其潛在客戶是需要機器人具備複雜多階段行為推理的服務供應商或終端用戶,。
- 其他機器人實體製造商: 由於 $\pi_{0.5}$ 證明了可以從異質機器人數據(ME, CE, MM)中遷移知識,PI 的軟體(作為通用政策模型)未來可能授權給各類具體化人工智慧 (Embodied AI) 設備製造商,,。
總結比喻: Physical Intelligence 的做法就像是在打造機器人界的「通用作業系統」。他們不只讓機器人學會「跳舞」(特定動作),而是透過網路數據與各種機器人的經驗(跨實體協同訓練),讓機器人具備了「生活常識」;因此,無論是哪一家的硬體手臂,只要搭載這套軟體,就能在陌生的廚房裡知道該如何整理雜物。