11/30/25

1x Neo用電動而非油壓馬達

在機器人領域,「動力源」的選擇決定了機器人的重量、安靜程度以及安全性。

直接給您答案:1X Technologies 的 Neo (包括 Gamma 版本) 完全使用的是「電動馬達」,而非油壓馬達。

雖然它的動作看起來非常滑順,甚至有點像油壓系統那樣具有彈性,但這其實是透過他們獨家研發的 「Revo1」高性能無刷直流馬達 (BLDC) 配合 「腱趨動 (Tendon Drive)」 技術達成的。

以下為您拆解 Neo 為什麼不選油壓,以及它的電動系統有什麼厲害之處:

1. 為什麼 Neo 不使用油壓 (Hydraulic)?

油壓系統(如早期波士頓動力的 Atlas)雖然力量極大,但對於「居家機器人」來說有致命缺點:

 * 噪音巨大:油壓泵浦會發出高頻的運轉聲,不適合放在客廳。

 * 漏油風險:家中有地毯和家具,一旦油壓管路損壞,清潔與維護將是災難。

 * 重量與體積:油壓需要泵浦、油箱與厚重的管路,無法讓 Neo 保持在 30kg 這種輕盈的體型。

2. Neo 的核心動力:Revo1 高扭矩馬達

1X Technologies 自行開發了名為 Revo1 的電動馬達。

 * 高扭矩密度:這款馬達在極低轉速下就能輸出巨大的扭矩,這讓 Neo 可以在不依賴高倍率減速機(通常會帶來摩擦力和生硬感)的情況下,輕鬆舉起重物。

 * 極致安靜:Neo 的運作噪音僅約 22 分貝,比家裡的冰箱還要安靜。

3. 電動馬達如何做出「油壓感」? (腱趨動技術)

這是 1X 最引以為傲的黑科技。他們不把馬達直接放在關節上,而是放在軀幹等中心位置,透過**強力的纖維繩索(類似人類的肌腱)**去拉動四肢。

 * 物理緩衝:電動馬達透過繩索拉動,賦予了關節一種「柔順性 (Compliance)」。當你推它一把,它會像真人一樣順勢擺動,而不是像傳統工業馬達那樣硬碰硬。

 * 低慣性:因為重重的馬達不在手腳末端,Neo 的肢體擺動非常輕快且安全,即使撞到人也不會造成嚴重傷害。

💡 機器人大師的技術對照

| 特性 | 油壓驅動 (Hydraulic) | 1X Neo 電動腱趨動 (Electric Tendon) |

| 主要代表 | 早期 Boston Dynamics Atlas | 1X Neo, EVE |

| 力量感 | 極強,適合暴力跳躍 | 適中,適合居家家務與精密操作 |

| 安全性 | 較低(剛性撞擊力大) | 極高(物理柔順性,輕量化) |

| 維護性 | 複雜,需定期換油、防漏 | 較簡單,僅需檢查驅動繩索與電控 |

總結來說: Neo 是一台「純電」機器人,它利用電動馬達模擬出了生物肌肉的質感。



石黑浩Erica用氣壓馬達

大多數工業或家務機器人(如 Tesla Optimus 或 Neo Gamma)追求精準、高扭矩而使用電動馬達時,石黑浩博士在 Geminoid 與 ERICA 系列中堅持使用氣壓致動器(Pneumatic Actuators),核心原因在於追求「生物級的自然感」。

以下是氣壓驅動在模擬人類肌肉上的四大獨特優勢:

1. 天然的「柔順性」 (Passive Compliance)

馬達與齒輪的組合通常是「剛性」的,一旦設定位置,外力很難推動,動作往往顯得生硬死板。

 * 氣壓優勢:空氣具有可壓縮性。當氣壓缸驅動臉部皮膚時,它就像真正的肌肉與脂肪一樣,具備天然的彈性。

 * 模擬效果:當 ERICA 微笑時,嘴角皮膚的拉扯不是僵硬的位移,而是一種帶有緩衝的「漸進式」擴張,這與人類軟組織的動態特徵完全一致。

2. 微細震顫與「生命律動」 (Micro-vibrations)

人類即便在靜止不動時,肌肉也會有極微小的收縮與震顫,這就是所謂的「生機」。

 * 氣壓優勢:氣壓系統在維持壓力時,會產生肉眼難以察覺但大腦能感知到的微小波動。

 * 模擬效果:這解決了機器人最可怕的「死寂感」。使用氣壓驅動的機器人,其眼球或眼皮在固定不動時,仍會有極其自然的微小晃動,讓觀者覺得這是一個「活著」的實體。

3. 高自由度與空間布局

要在人類臉部這麼小的空間內擠入幾十個控制表情的零件,馬達會面臨散熱與體積的巨大挑戰。

 * 氣壓優勢:氣壓缸本身可以做得非常細小(如手指大小),且動力源(空壓機)可以隱藏在機器人的底座或桌子下,透過細長的氣管將動力傳輸到臉部。

 * 模擬效果:這讓 Geminoid 的臉部能擁有超過 15 個以上的微表情控制點,而不需要像馬達機器人那樣擁有一個巨大的「大頭」,能維持精美的人類比例。

4. 加速度曲線更接近生物

電動馬達的啟動與停止通常非常迅速且線性。

 * 氣壓優勢:氣壓驅動的加速度曲線是非線性的,呈現「S型」。動作開始時輕緩,中間加速,結束時自然減速。

 * 模擬效果:這種「由慢到快再到慢」的過程,完美模擬了人類眨眼或轉動視線的物理特性。

⚠️ 氣壓驅動的權衡(代價)

雖然氣壓在「擬真」上無敵,但它也有石黑博士必須克服的缺點:

 * 噪音問題:空壓機與排氣閥會發出噴氣聲(這也是為什麼石黑博士的展場常有背景音樂或將設備隔離開)。

 * 控制難度:空氣受溫度與壓力影響大,不像馬達那樣能精準控制到 0.01 毫米。

 * 維護成本:氣管老化與漏氣是家常便飯。

🤖 大師觀點:為何 1X Neo 不用氣壓?

既然氣壓這麼像人,為什麼 1X Technologies Neo Gamma 不用?

因為 Neo 需要「幹活」。氣壓系統的能量轉換效率低、力量密度難以支撐搬運重物,且無法長時間精準維持某個力量輸出。石黑博士做的是「表演者與溝通者」,而 Neo 做的是「勞動者」,這決定了兩者在零件選擇上的分水嶺。


11/29/25

石黑浩(2): Avatar(虛擬分身/替身)機器人

 石黑浩教授目前提出的 Avatar(虛擬分身/替身) 機器人,與其早期開發的 Geminoid(雙子機器人) 在定義與目標上既有延續性,也存在顯著的新主張與戰略轉移。

一、 Avatar 與 Geminoid 的關係與區別

  • 定義的擴大:Geminoid 是指外觀極度擬合特定真人的「雙子」機器人。而 Avatar 的定義更廣,涵蓋了所有遵循人類意圖(Intent)行動的遠程操作媒介,包括實體機器人(如 Geminoid)以及 CG(電腦繪圖)角色
  • 從「像人」到「為人服務」:Geminoid 的早期研究側重於探索人類的「存在感」與「對人的認知限制」。現在石黑浩的主張更強調透過 Avatar 技術讓人類從物理身體、空間、時間的制約中解放,以解決高齡化與勞動力短缺等現實社會問題。

二、 石黑浩的新主張:Avatar 第一與共生社會

  • 「Avatar 第一」策略:石黑浩意識到實體人形機器人因成本高昂、移動困難且缺乏明確市場,難以立即大規模普及。他的新主張是先透過 CG Avatar(如虛擬店員、動畫分身)建立市場規模。一旦社會習慣了與虛擬分身互動,再逐步將高附加價值的環節替換為實體人形機器人。
  • 跨越能力的擴展:他認為 Avatar 不應只是人類的複製品,而應具備超越人類本身的能力。透過整合 AI(如大語言模型、情感識別),單一操作者可以同時高效地控制多個 Avatar 提供服務。

三、 發展現狀與未來展望

  • 現狀:Avatar 技術已進入商業化實踐,例如在 Lawson 便利商店提供自助結帳輔助,或在生命保險公司(如 Advance Create)擔任銷售,其客戶指名率甚至高於真人。此外,它也應用於遠距醫療,讓專家能遠程「降臨」在醫療資源匱乏的離島進行診療。
  • 未來:日本政府的 「射月計畫(Moonshot)」 目標是在 2050 年前建立一個任何人都能自由使用多個分身參與社會活動的社會。2025 年大阪萬博也將展示「50 年後的未來」場景,屆時機器人將與人類進行複雜的社會互動與演劇。

四、 認知科學研究的意義與價值

  • 探究人類本質:石黑浩採用 「合成方法」,透過建造機器人來理解人類的高階認知功能(如意識、情感與自我)。
  • 身體具現感(Embodiment):研究發現操作者在控制 Avatar 時,會產生身體具現感,即便機器人被針刺,操作者也會產生生理反應。這證明了人類大腦對身體邊界的認知具有極高可塑性。
  • 消除歧視與社會包容:透過 Avatar,身心障礙者或高齡者能消除生理限制帶來的差別對待,實現真正的社會包容與多樣性。

五、 日本與中、美機器人的差異

石黑浩指出,日本在發展人形機器人上擁有獨特路徑,但正與中、美形成競爭:

項目

石黑浩(1) 過去代表性的人形機器人

 大阪大學的石黑浩(Hiroshi Ishiguro)博士是全球「人機交互」與「機器人科學」的領軍人物。他的設計理念核心在於**「存在感(Presence)」**——探討機器人要在什麼程度下才能讓人類感受到對方的「心靈」或「靈魂」。

以下為您詳細解析這幾款指標性機器人的設計、應用與現況:

1. Geminoid HI 與 Geminoid F:尋找人類存在的「分身」

這兩款是石黑浩博士最著名的「Geminoid(分身機器人)」系列。

 * 設計原理:

   * Geminoid HI (Hiroshi Ishiguro):以石黑博士本人為原型。採用氣壓驅動(Pneumatic Actuators),具備約 50 個自由度。它不是為了 AI 自主行動,而是透過「遠程操作」讓博士的身影出現在遠方,測試人類是否能透過機器人感受到「本人的存在」。

   * Geminoid F (Female):以 20 多歲女性為原型。為了降低成本與重量,自由度縮減至 12 個,主要集中在臉部表情,使其能展現極其自然的微笑與眨眼。

 * 應用場景與反應:

   * HI 系列:用於學術講座、遠距教學。

   * F 系列:跨足藝術領域。曾主演舞台劇《莎喲娜啦》及同名電影,成為史上第一位「機器人演員」。

 * 現況:主要作為「遠程傳輸(Telepresence)」的實驗平台,研究人類如何將自我意識投射到機器軀體中。

2. Otonaroid (大人型) 與 Kodomoroid (小孩型)

這兩款機器人曾是東京日本科學未來館(Miraikan)的長期展品。

 * 設計原理:基於「角色設定」的設計。Otonaroid 呈現成熟女性形象,Kodomoroid 則是具備播報新聞能力的兒童形象。

 * 應用場景:在科學館中擔任導覽員。參觀者可以親自操作 Otonaroid,透過它的眼睛看世界,透過它的嘴說話,體驗「換一個身體生活」的感覺。

 * 現況:在 2014-2022 年間引發巨大轟動,是許多人接觸「恐怖谷理論」的第一現場。目前已完成階段性任務,轉為研究數據。

3. Alter (阿爾特):追求「生命的律動」

Alter 與上述擬真外表的機器人完全不同,它故意露出內部的機械結構。

 * 設計原理:採用**人工生命(Artificial Life)**理論。核心是一個「神經網絡系統」,不設定固定動作指令,而是讓機器人根據感測器接收到的雜訊、光影、溫濕度,自主生成「混亂且像生物般」的動作。

 * 應用場景:主要用於藝術展覽與科學探索。它曾在歌劇中與人類歌手同台,展現出非預設的靈魂感。

 * 市場反應:大眾普遍感到其動作既神祕又令人敬畏,成功突破了「只是設定好程式的機器」的刻板印象。

4. ERICA:邁向「最完美的溝通者」

ERICA 被石黑博士譽為「世界上最美麗且最聰明的擬人機器人」。

 * 設計原理:

   * 感測器系統:搭載麥克風陣列、RGB 相機與雷達,能精準判別說話者的方位、語氣與視線。

   * AI 對話內核:目標是通過「全面圖靈測試」。她具備自然的傾聽(Backchanneling)、點頭、換氣聲與眼神流轉,解決了以往機器人對話時那種死氣沉沉的尷尬感。

 * 應用場景:目前重點在「面試官培訓」與「高齡者關懷」。她能透過專注的傾聽讓人類願意對她吐露心聲。

 * 現況:目前是石黑實驗室的研究主力。她甚至擁有自主主持節目的能力,並持續進化其「幽默感」與「共情能力」。

💡 總結比較

| 機器人 | 核心特色 | 驅動方式 | 主要目的 |

| Geminoid HI/F | 博士的分身 | 氣壓驅動 | 測試「存在感」與「身分認同」 |

| Otonaroid | 公眾互動員 | 氣壓驅動 | 探索社會大眾對擬人機器人的接受度 |

| Alter | 機械感、自主行為 | 氣壓/神經網路 | 探討「何謂生命」的本質 |

| ERICA | 極高對話智慧 | 氣壓/精密 AI | 建立能與人類產生情感連結的社交 AI |

石黑博士的機器人與 Tesla Optimus 那類追求「工作效率」的機器人截然不同。他的作品更像是在做「人體與心靈的鏡子」。


認知發展機器人學 (3): 石黑浩的人形機器人發展歷程

 從認知發展機器人學 (Cognitive Developmental Robotics, CDR) 的脈絡來看,石黑浩教授的人形機器人研發歷程不僅是工程技術的突破,更是一種**「合成方法」 (Synthetic Approach)** 的實踐,旨在透過建構機器人的過程,驗證有關人類認知、意識與社會互動的科學假設。

以下結合來源資料,說明其發展歷程、背後的 CDR 邏輯以及具體的機器人案例:

一、 核心哲學:透過「建構」來理解人類

CDR 的核心理念是**「物理實體具現」 (Physical Embodiment),主張智能源於身體與環境的互動。石黑浩將機器人視為一種研究人類的工具,他的發展動力源於一個根本問題:「人是什麼?」**。

  • 假設驗證:在 CDR 框架下,研究者根據對人類認知功能的假設來設計機器人。如果機器人表現得極度像人,則代表該設計反映了我們對人類的正確理解。
  • 身體形塑大腦 (Body Shapes Brain):他強調機器人的物理結構(如仿生肌肉)對於產生擬人化的行為至關重要,這呼應了 CDR 認為身體結構會影響資訊處理與認知發展的觀點。

二、 發展歷程與實際案例

石黑浩的研發歷程可分為幾個關鍵階段,每個階段都對應到不同的認知科學目標:

1. 模仿生物肌肉與潛意識行為 (早期擬人階段)

為了克服傳統馬達動作僵硬的問題,石黑浩採用了氣動執行器 (Pneumatic Actuators) 來模擬人類肌肉的柔順性。

  • 機器人案例:女性 Android (2004年):這台機器人模擬了人類的潛意識動作(如呼吸時肩膀的微動、眨眼等),研究發現這些微小的動作是讓人感到「生命感」的關鍵。
  • 技術特點:使用高度敏感的仿生皮膚與複雜的機械設計,試圖跨越「不給力」的技術限制,追求極致的外觀擬真。

2. 探究「存在感」與「身體感」 (Geminoid 階段)

石黑浩開發了 Geminoid (雙子機器人),這是一種精確複製特定真人的機器人,旨在研究人類如何感知「存在」 (Presence)。

  • 機器人案例:Geminoid HI-2 與 Geminoid-F:HI-2 是石黑浩本人的複製品,具備 50 個自由度。
  • CDR 應用:透過遠端操作 (Teleoperation),操作者會產生「身體具現感」,即當機器人被觸碰或注射時,操作者會感覺到彷彿自己的身體也被觸碰。這驗證了人類大腦對身體邊界的認知具有高度的可塑性。

3. 極簡化設計與想像力的最大化 (Telenoid 階段)

在追求擬真的過程中,石黑浩發現過於具體的特徵(如性別、年齡)有時會限制互動。

  • 機器人案例:Telenoid:外觀被設計為一種**「極簡的中性特徵」**。
  • 認知科學邏輯:這種中性設計能最大化使用者的想像力。當老人與 Telenoid 對話時,他們會將心目中理想的形象投射在機器人身上,從而減少心理壓力,這對安寧病房或長照環境具有高度價值。

4. 自主互動與社會共生 (Erica 與 未來 Avatar 階段)

最新的階段轉向了具備自主對話能力的系統,並將目標鎖定在解決社會問題(如勞動力短缺)。

  • 機器人案例:Erica:被視為目前最先進的自主對話安卓機器人,能透過 AI 識別對方的表情與語音,並獨立決定話題策略。
  • 社會應用 (Avatar):石黑浩推動的 「Cybernetic Avatar」 (虛擬分身) 計畫,目標是讓人在 2050 年前能透過遠端操作多個機器人分身,打破物理身體、時間與空間的限制。

三、 發展歷程的科學價值總結

石黑浩的歷程完美體現了 CDR 的研究路徑:

  1. 從身體表徵到社會行為:早期專注於感官運動(肌肉與表情),後期專注於社會認知(對話、共同注意力與同理心)。
  2. 人機共生設計:他不只是在製造機器,是在建立一套與人類共生的新設計理論。
  3. 跨學科融合:他的研究讓理科的工程技術與文科的哲學(意識、自我)合而為一,將機器人視為研究人類本質的「畫布」。

譬喻: 石黑浩開發人形機器人的過程,就像是在拼湊一面名為「人類」的拼圖。他並非直接研究拼圖塊(細胞或神經),而是試著自己動手「複製」每一塊拼圖;當機器人能在社會中與人產生連結、讓人流淚、甚至讓人感覺它有靈魂時,那塊遺失的「人性的定義」便在建構的過程中顯現了出來。

認知發展機器人學(2) 現代的重點與未來發展

這篇由淺田稔(Minoru Asada)教授等人於 2009 年發表的論文 《Cognitive Developmental Robotics: A Survey》(認知發展機器人學:綜述),是該領域的里程碑。它不僅定義了認知發展機器人學 (Cognitive Developmental Robotics, CDR) 的核心架構,也深刻影響了後來的人工智慧與機器人研究方向。

一,  關於 CDR 的關鍵要點:

認知發展機器人學 (Cognitive Developmental Robotics, CDR) 旨在透過一種發展性的合成方法(synthetic approach),建構認知功能,從而為人類高階認知功能如何發展提供新的理解。

CDR 的核心概念是**「物理實體具現」** (physical embodiment)。此概念認為,代理人的物理身體定義了其與環境(包括其他智能體)互動時的約束條件,這不僅產生了豐富的過程或結果內容,也是形成認知和行動的物理基礎設施。這種具現化的理念是基於人類認知功能從身體表徵發展到社會行為的假設模型所建構。

1. 研究目標與範式

CDR 的主要目標是應對讓人工系統更智能的挑戰,因為現有系統即使在固定環境中,能力也有限。CDR 採用合成方法,該方法結合了解釋理論 (explanation theory) 和設計理論 (design theory),以期彌補現有學科之間的鴻溝,並提供對人類認知發展的新理解。

CDR 致力於建立一個新範式,這個範式不僅能讓我們對自身有新的理解,同時也為設計與我們共生的人形機器人 (humanoids) 提供新的設計理論。

2. 發展模型與階段

CDR 的發展模型是基於對人類認知功能如何發展的假設,這個發展過程包含兩個主要階段:

  • 早期階段:個體發展 (Individual development):這主要涉及個體內部資訊的結構化,例如身體表徵、運動意象和物體恆存性 (object permanency) 的形成,主要與神經科學(內部機制)相關。在早期發展中,與各種物理環境的互動起著主要作用。
  • 後期階段:社會發展 (Social development):這主要涉及透過個體間的互動,例如早期溝通、共同注意力 (joint attention)、模仿以及口語溝通等社會行為的逐步湧現。這主要與認知科學發展心理學(行為觀察)相關。

在這兩個階段中,環境(包括其他智能體/照顧者)扮演著「鷹架」(scaffolding) 的角色,觸發感覺運動映射,促進嬰兒的自主性、適應性和社會性。

3. CDR 的核心方法論

CDR 的合成方法主要包括兩大方面:

  • 建構認知發展的計算模型:這涉及基於現有學科知識提出計算模型或假設,然後透過電腦模擬(例如,模擬身體生長等難以在真實機器人上實現的過程),並最終使用真實代理人(人類、動物和機器人)進行假設驗證。
  • 提供新的手段或數據以更好地理解人類發展過程:這包括透過成像方法(如 fMRI)測量大腦活動,利用人類或動物受試者進行驗證,以及將機器人作為心理實驗中可靠的重現工具

CDR 強調,來自物理具現及其與環境互動的結構化資訊,對於確定連接權重以及整體大腦活動(包括運動輸出)至關重要,即**「身體形塑大腦」** (body shapes brain)。

二, 對於現代人型機器人學的影響


1. 認知發展機器人學對現代機器人學習與應用的幫助

CDR 的核心概念是「合成途徑」(Synthetic Approach):透過模擬生物(尤其是嬰兒)的發育過程來構建機器人的認知能力,而非直接編寫複雜的規則。這對現代機器人學有以下三大幫助:

  • 物理具身性 (Physical Embodiment) 的確立: CDR 強調智慧不能僅存在於演算法(大腦)中,必須透過身體與環境的互動產生。這啟發了現代的體現智慧 (Embodied AI),使機器人能透過觸覺、視覺的回饋,自主學習物體的抓取與導航。

  • 資訊結構化與自主學習: 不同於傳統監督式學習需要大量標記數據,CDR 提倡機器人應像嬰兒一樣,從無意義的感官數據中自行發現規律(如:動手會導致物體位移)。這直接推動了現代強化學習 (Reinforcement Learning)自監督學習在機器人控制上的應用。

  • 社交互動的基礎架構: 論文中提到的「聯合注意」(Joint Attention) 與「鏡像神經元」模擬,為現代人機協作 (HRI) 奠定了理論基礎,使機器人能理解人類的意圖、手勢,甚至產生同理心反應。


2. 對大阪大學石黑浩 (Hiroshi Ishiguro) 博士的看法與影響

石黑浩博士不僅是該論文的共同作者之一,他也是 CDR 領域的重要實踐者。

  • 「分身」(Geminoid) 與 CDR 的驗證: 石黑浩以製作極其擬真的類人機器人聞名。對他而言,CDR 提供了一種**「科學驗證的工具」**。他認為,如果我們能用 CDR 的理論讓一個擬真機器人展現出類人的行為,那我們就更接近「什麼是人」的哲學答案。

  • 外觀與認知的相互影響: 石黑浩的研究深受 CDR 中「身體表現」(Body Representation) 的影響。他發現,當機器人的外觀越接近人類,人類對其認知的期望就越高,這反過來要求機器人的認知發育必須更完善,才能避免「詭異谷效應」。

  • 推動「社會性發育」: 石黑浩目前的重心(如 2025 年大阪萬博會的項目)是開發能與人產生情感共鳴的虛擬分身(Avatar)。這正是 CDR 中從「個體發育」走向「社會互動」的終極體現。


3. 未來機器人學發展的趨勢

根據 CDR 的演進與當前技術,未來的發展呈現以下三個趨勢:

1. 物理 AI (Physical AI) 與 大語言模型 (LLM) 的結合

未來的機器人將不只是會說話的 ChatGPT。目前的趨勢是將 基礎模型 (Foundation Models) 引入實體世界。機器人將具備「常識」,知道「把杯子拿過來」需要考慮摩擦力、重力與空間路徑,這正是 CDR 長期追求的「具身認知」。

2. 終身學習與適應 (Lifelong Learning)

機器人將不再是出廠時就設定好所有功能。未來的趨勢是機器人能像人類一樣,在投入使用的環境中持續學習。當環境改變或硬體老化時,它能透過 CDR 提到的自我標定與發育機制進行調整。

3. 共感社會與虛擬分身 (Avatar Society)

如石黑浩所預測,未來將進入「人類—機器人共生社會」。

| 趨勢維度 | 具體表現 |

| 感官融合 | 具備更細膩的觸覺與情緒識別,達成「類人」的互動感。 |

| 遠端存在 | 透過 VR/AR 操控機器人分身,打破身體、空間、時間的限制。 |

| 道德與法律 | 當機器人具備高度認知能力,其法律地位與倫理界線將成為討論核心。 |


認知發展機器人學 (1) IEEE 論文摘要

 Cognitive Developmental Robotics: A Survey

M. Asada et al., "Cognitive Developmental Robotics: A Survey," in IEEE Transactions on Autonomous Mental Development, vol. 1, no. 1, pp. 12-34, May 2009, doi: 10.1109/TAMD.2009.2021702

本篇論文是對認知發展機器人學 (Cognitive Developmental Robotics, CDR) 的一項綜合性調查,旨在藉由一種發展性建構認知功能的合成方法,提供對人類高階認知功能如何發展的新理解。

研究目的 (Research Purpose)

CDR 的核心理念是**「物理實體具現」** (physical embodiment),這使得資訊能夠透過與環境(包括其他智能體)的互動來形成結構。這項理念是基於人類認知功能從身體表徵發展到社會行為的假設模型所建構。

研究人員指出,現有系統即使在固定環境中,能力也有限,而高階認知功能的機制知識稀缺,導致人工系統的設計僅基於設計者對這些功能膚淺的理解。一個更嚴重的問題是,如果高階認知功能是透過初級功能發展而來,那麼現有對初級功能的理解和實現是否足夠。

本研究的目的之一是透過一種合成方法 (synthetic approach) 來回答這些問題。此方法結合了解釋理論 (explanation theory) 和設計理論 (design theory),旨在填補現有學科之間的鴻溝,並提供對人類認知發展的新理解。具體來說,CDR 的目標是建立一個新範式,既能提供對我們自身的新理解,同時也能為與我們共生的人形機器人提供新的設計理論。

主要文獻 (Key Literature)

本研究是一項調查報告,涉及多個相關學科,包括人工智慧、機器人學、神經科學、認知科學、發展心理學和社會學。

CDR 的基礎是身體具現 (physical embodiment) 概念,它被定義為代理人的物理身體規定了其與環境互動的約束條件,從而產生豐富的內容和後果,並為認知和行動提供了物理基礎設施。

CDR 的發展模型借鑒了神經科學和發展心理學的現有知識。發展過程分為兩個主要階段:早期階段的個體發展,主要與神經科學(內部機制)相關;以及後期階段透過個體間互動的社會發展,主要與認知科學和發展心理學(行為觀察)相關。

在具體的文獻探討中,論文涵蓋了胎兒運動和感覺的觀察報告,神經科學中關於運動控制和注意力的發現,以及發展心理學中關於新生兒模仿、早期溝通 (例如躲貓貓遊戲)、共同注意力 和同理心發展的研究。

研究方法 (Research Methods)

CDR 採用合成方法,旨在建構計算模型並同時提供理解人類發展的新手段。

研究方法主要包括兩個方面:

A) 認知發展計算模型的建構 (Construction of computational model)

  1. 假設生成:基於現有學科知識提出計算模型或假設。
  2. 電腦模擬:模擬難以用真實機器人實現的過程,如身體生長。
  3. 假設驗證:使用真實代理人(人類、動物和機器人)進行驗證。

B) 提供新手段或數據以更好地理解人類發展過程 (Offer new means or data)

  1. 透過成像方法(如 fMRI)測量大腦活動。
  2. 利用人類或動物受試者進行驗證。
  3. 將機器人作為心理實驗中可靠的重現工具

技術平台與實體具現: CDR 強調物理實體的重要性,因此研究中使用了特殊的機器人平台。例如,研究採用了 McKibben 氣動執行器作為仿生人工肌肉,以實現與傳統電磁馬達相比更具動態和柔性的運動。 研究平台還包括 CB (Child robot with Biomimetic body),這是一款具有仿生身體的兒童機器人,其特點是全身柔軟的皮膚(帶有許多觸覺感測器)和柔性關節(51 個氣動執行器),旨在建立和維持長期的人機社會互動。

計算模擬實例

  • 胎兒運動模擬:Kuniyoshi 和 Sangawa 建立了胎兒模擬模型,該模型包含漂浮在子宮環境中的肌肉骨骼身體和一個最少的神經系統,以證明各種有意義的運動模式可以自發出現 (emerge)。
  • 社會行為模擬:透過獎勵預測模型來實現機器人學習躲貓貓的溝通行為。在元音模仿研究中,研究人員利用高斯混合網路 (GMN) 模型來模擬模仿機制,其中包含了照顧者的自動鏡像偏差 (automirroring bias) 和感覺運動磁鐵效應 (sensorimotor magnet effect)。

研究結果 (Research Results)

  • 身體形塑大腦 (Body Shapes Brain):胎兒模擬結果顯示,多種全身運動模式是從身體、環境和神經系統之間的互動中純粹湧現出來的,這表明身體和環境互動產生的結構化資訊對於確定連接權重和整體大腦活動至關重要,即「身體形塑大腦」。
  • 身體表徵和空間感知:合成方法研究表明,機器人可以透過學習視覺、觸覺和本體感覺之間的關聯來發展跨模態身體表徵 (cross-modal body representation)。例如,透過視覺注意力圖引導,機器人可以獲得與工具使用相關的視覺感受野,其結果與猴子頂葉神經元的活動相似。
  • 動態運動機制:研究人員利用仿生肌肉骨骼系統 (pneumatic artificial muscles) 實現了動態運動,例如穩定的彈跳動作。這類機器人表明控制和身體結構緊密相連,身體本身具有控制計算的功能。此外,透過 CB 機器人實驗證明,利用其關節柔性,即使沒有精確的位置控制,也能吸收誤差,實現與人類的流暢物理互動和動作同步。
  • 社會認知發展:fMRI 研究揭示了對自身與外部生成運動的內在監測存在功能側化:右側後頂葉皮層 (PPC) 在目標隱藏時表現出更高的活動,主要估計外部生成運動;而左側 PPC 在游標隱藏時表現出更高的活動,主要估計與自身身體運動一致的物體。
  • 溝通和模仿:關於元音模仿的計算模型結果顯示,照顧者帶有感覺運動磁鐵和自動鏡像偏差的模仿,能有效地引導嬰兒的元音類別朝向正確的對應位置。對於共同注意力 (Joint Attention) 的發展,研究表明,學習的關鍵是再現互動中的偶發性 (contingency),而非僅僅依賴獎勵。

研究後續的應用 (Future Applications)

CDR 致力於攻擊高階認知發展的主要問題,並為人類發展提供更深入的理解。後續的應用和研究方向包括:

  1. 模型細化與驗證:需要透過不斷的相互回饋,在現有簡單模型中增加更多的大腦區域、感官器官和身體部位的細節,以實現更真實的模擬。
  2. 硬體平台改進:需要改進平台,特別是缺乏適用於發展研究的良好平台,例如帶有觸覺感測器的手指-手-手臂系統。
  3. 釐清運動與認知的關係:需要新的實驗方案來建模運動技能發展與認知發展之間的途徑,例如它們是「相互觸發」還是「相互干擾」。
  4. 解決關鍵發展階段:「物體恆存性」(Object permanence) 是發展高階認知功能的重要步驟,但尚未被合成方法系統性地解決,因此是一個很好的目標。
  5. 發展性障礙研究:利用 CDR 的合成方法研究自閉症譜系障礙 (ASD) 和威廉斯綜合症 (WS) 等發展性障礙,可以建構計算模型來解釋這些障礙的結構,從而創造 CDR 的新科學價值。
  6. 邁向口語溝通:未來的工作將會探討多模態共同注意力如何透過交叉促進學習來發展,以及如何整合凝視追蹤和詞彙-物體映射的學習,以促進口語的習得。

11/24/25

日本人形機器人(3) 人與機器共生

 根據來源文件《2050 年機器人產業願景》,機器人產業在社會層面的**「共生」(共生,Symbiosis)**定義及核心內涵如下:

一、 核心定義

「人類與機器人的共生」意指機器人與人類在同一個活動空間中共同生活。 隨著機器人功能的提升,它們將更深入地參與人類生活,因此被要求必須能「自然地融入」日常環境中。

二、 共生的關鍵支柱

為了實現安全且受信任的共生社會,必須具備以下四大要素:

  1. 影響(Impact): 機器人需對人類的幸福感(Well-being)、經濟價值創造及社會永續性產生積極影響。
  2. 治理(Governance): 需建立涵蓋**倫理、法律、社會議題(ELSI)負責任的研究與創新(RRI)**的治理框架,並讓多方利害關係人參與。
  3. 風險(Risk): 必須從技術與社會制度兩方面確保安全性。共生社會不僅要求機器人不傷害人,還要求其動作不會讓人類感到恐懼或威脅(安心感)。
  4. 感官建構(Sense-making / 社會受容性): 機器人必須被社會大眾(非僅專業操作者)理解並贊同,消除人們對機器人的違和感或不安。

三、 關係性的轉變

在共生社會中,人與機器人的關係不再是單純的「替代」,而是轉向以下方向:

  • 從「人力替代」轉向「系統與組織的成長促進」: 機器人被視為一種「便利的工具」,幫助人類從重體力勞動或複雜思維壓力中解放,讓不同世代的人都能更輕鬆地參與社會。
  • 角色分擔與相互理解: 透過 AI 技術,機器人能理解人類的意圖、情感與社會規範,實現流暢的溝通與協作。
  • 多樣性與尊嚴: 共生社會強調尊重個人尊嚴,機器人應輔助人類克服身體或時間限制,而非奴役人類。

四、 社會制度的配合

真正的共生不僅是技術問題,更需要社會制度的變革。來源指出,必須建立**「技術開發、安全標準、保險制度」三位一體**的社會框架,以應對機器人融入日常後可能產生的殘餘風險。


💡 類比理解: 如果早期的機器人像是工廠裡**「隔著圍欄工作的機器」(雖然有用但具危險性且界限分明),那麼共生社會中的機器人就像是「家中不用拴繩的導盲犬或室友」**:牠們與你共享空間、理解你的需求,而你對牠們的存在感到安全且習以為常,並在牠們的協助下獲得更高品質的生活。

法律與保險上的挑戰

根據來源資料,實現「人機共生社會」不僅是技術問題,更需要建立一個**技術開發、安全標準與保險制度「三位一體」**的社會框架,以應對機器人進入日常生活後產生的各種挑戰,。

以下是法律與保險層面所面臨的主要挑戰:

一、 法律層面的挑戰

  1. 責任歸屬的釐清:

    • 當機器人(尤其是具備 AI 自主判斷能力的機器人)發生事故時,責任應由誰承擔(如開發者、使用者或服務提供者)仍是法律上的難題。
    • 目前缺乏統一的遠距操作安全規格與事故處理規範,這包含如何應對駭客攻擊、操作指令被非法竄改或緊急停機後的責任歸屬,。
  2. 隱私與數據治理(ELSI):

    • 機器人透過感測器長期蒐集使用者的「生活日誌(Lifelog)」,涉及大量敏感隱私,。目前對於隱私數據的組織化管理、共享與利用規範尚不健全,亟需制定相關法律來平衡數據利用的效益與風險,,。
    • 法律需處理倫理、法律、社會議題(ELSI)以及負責任的研究與創新(RRI),確保技術發展符合社會公德。
  3. 標準化與分級制度:

    • 法律面需要制定如同自動駕駛分級(Level 0-5)般的**「人機共生分級制度」**,並根據不同等級制定相應的設計指南與法律規範。
    • 目前各國或各認證機構的安全認證標準不一,缺乏全球通用的法律框架來支撐機器人產品的跨國普及。
  4. 特殊場域的介入法規:

    • 對於機器人介入家庭育兒、兒童教育或公共行政服務,法律需針對機器人對弱勢族群(如兒童)的心理與身體安全性建立更嚴格的介入規範,。

二、 保險層面的挑戰

  1. 「殘餘風險」的覆蓋:

    • 機器人的便利性與風險往往成正比。即便技術開發再先進,仍會存在無法完全消除的**「殘餘風險(Residual Risks)」**,。
    • 保險制度的挑戰在於如何根據不同的利便性與風險等級,設定合理的保險費率
  2. 多樣化補償機制的建立:

    • 機器人進入家庭或物流領域,可能造成家產損壞或身體傷害,。
    • 保險業需針對物流無人機、家事機器人、介護機器人等不同情境,開發專屬的責任險與損害險,以降低使用者導入機器人的心理門檻與經濟負擔,。
  3. 三位一體的信任協作:

    • 保險公司、機器人製造商與政府認證機構必須緊密聯動,透過累積大量安全使用的成功案例,來建立使用者的信任感,並藉此精準估算風險以維持保險體系的運轉。

💡 類比理解: 推動人機共生社會就像是**「在大城市推廣自動駕駛汽車」**。即使汽車本身裝滿了感測器(技術開發),如果沒有明確的交通法規(法律標準)以及發生車禍後的理賠制度(保險機制),人們就不敢輕易讓自動駕駛車上路。只有當法律告訴我們誰該負責,且保險能保障意外損失時,機器人才會像現在的家電一樣,真正走入日常生活的每個角落。

日本人形機器人(2) 關鍵因素, 利害關係人

三大關鍵要素

根據該報告的結論,2050 年機器人產業化的三大「勝負所」(關鍵決勝點)分別為:「全球性需求」(グローバル要請)「幸福感」(ウェルビーイング,Well-being)以及「國際競爭力」,,。

1. 全球性需求(グローバル要請)

機器人產業應致力於解決全球面臨的共同課題,這不僅是社會責任,也是發展重點。

  • 貢獻領域: 包括環境問題(氣候變遷、資源枯竭)、貧窮與不平等、公共衛生(大流行病)、和平與安全保障、以及高齡化導致的勞動力減少等。
  • 關鍵技術基盤: 為了回應這些需求,報告提出了三項重點技術:環境負荷減低技術(如省電、輕量化)、模組化與追踪技術(有利於回收與再利用)、以及通訊基盤技術(如多語言對話、感性互動)。

2. 幸福感(ウェルビーイング,Well-being)

將「幸福感」視為機器人產業的核心價值,使產業從單純的技術提供者進化為實現人類幸福的基幹產業。

  • 多層次的支援:
    • 個人層面: 透過穿戴式輔助機器人或心理支持機器人,增進身心健康。
    • 組織層面: 在職場或家庭中透過協作機器人減輕負擔,促進溝通。
    • 社會層面: 透過智慧交通、行政自動化與災害支援,確保社會全體的安全與包容性。
  • 品牌化戰略: 建立「幸福感機器人認證制度」,並將日本的「款待文化」(おもてなし)融入互動設計,形成具有國際競爭力的品牌,。

3. 國際競爭力

為了扭轉日本產業競爭力停滯的現狀,報告強調必須在機器人領域進行典範轉移(Paradigm Shift),。

  • 從「人力替代」轉向「價值創造」: 機器人的角色應從單純替代勞動力,轉變為促進系統與組織成長的工具。
  • 強化軟體與數位化: 不再將機器人視為單一裝置,而是建立 CPS(賽博實體系統),推動**「機器人轉型」(RX, Robot Transformation)**,即以機器人為前提重新定義業務流程,。
  • 活用日本優勢: 將日本傳統的「現場力」(現場經驗與技術)轉化為形式科學(將暗默知轉為形式知),並結合直覺易用的介面,開發符合國際標準的系統以開拓世界市場,。

這三者構成了一個互補的體系:透過解決全球性需求展現社會價值,以幸福感作為產品的核心競爭力,並藉由強化國際競爭力帶動經濟成長,最終實現「以人為本」的永續社會,。

「六方皆好」(六方よし)的理念

是在日本傳統商業精神「三方皆好」(三方よし)的基礎上進行擴展,將其納入機器人產業戰略中。這六個對象分別包含:

  1. 賣方(売り手)
  2. 買方(買い手)
  3. 世間/社會(世間/社会)
  4. 製造者(作り手)
  5. 地球(地球)
  6. 未來(未来)

理念背景與目的

報告指出,過去的產業戰略主要重視賣方、買方與社會三者的和諧,但為了應對全球性的挑戰,未來的機器人產業必須進一步考慮到製造者的權益地球環境的永續以及對未來世代的責任。透過將這六個對象納入考量,機器人技術的開發與產業化將能更有效地調和減輕環境負荷評估社會影響以及實現永續經濟成長等目標。

日本的人形機器人(1) 日本2050 的願景

這份由一般社團法人日本機器人工業會(JARA)於 2025 年 6 月發布的《2050 年機器人產業願景(Ver.1.0)》,旨在描繪機器人如何與人、社會及環境共存,並達成全人類的「幸福感(Well-being)」。以下為該報告的摘要說明:

一、 背景與看到的問題

報告指出,日本正處於「失落的三十年」,面臨多重內外部挑戰:

  • 內部環境: 勞動力人口急劇減少(預計 2056 年跌破 5,000 萬人)、少子高齡化導致社會保障負擔加重、國際競爭力下降(IMD 排名大幅下滑)、以及社會基礎設施老舊化(建設 50 年以上的設施激增)。
  • 外部環境: 全球性貧富差距、資源與食糧短缺、氣候變遷(全球暖化)、地政學風險(如戰爭引發的能源危機)以及**大規模流行病(Pandemic)**的威脅。
  • 產業問題: 日本雖在產業用機器人具優勢,但在服務型機器人的商業化上落後於海外,且研發成果轉化為生產力的效率低落。

二、 機器人可以解決的問題

機器人被定義為「課題解決型技術」,旨在達成「サステナブル(永續)社會」:

  • 平時(智慧社區/生產): 機器人將代行瑣碎家務、輔助介護與育兒,讓人們從重複性勞動中解放,追求自我實現;在生產現場,則透過人機協作解決人力短缺並提高效率。
  • 非常時(災害/基礎設施): 在人無法進入的極限環境中執行災害復修,並透過自動化檢測技術預防基礎設施損壞,保障社會韌性。
  • 環境與健康: 協助達成碳中和(減輕環境負荷)並促進個人的身體、精神及社會性的全面幸福。

三、 目前的進展與待突破的瓶頸

  • 進展: 產業用機器人市場已破兆日圓,海外需求旺盛;AI(如 LLM 生成式人工智慧)、IoT、5G、數位分身(Digital Twin)及 XR 等尖端技術已開始應用於機器人開發。
  • 瓶頸:
    • 技術層面: 機器人對非定型作業與複雜環境的適應力不足,以及 AI 行動的安全性與預測性難題。
    • 社會層面: 缺乏統一的遠距操作安全規格、隱私與數據共享(Life Log)的法律規範尚未健全,且社會對機器人的心理接受度仍有門檻。
    • 經濟層面: 單一機器人開發成本過高、系統整合(SI)人才嚴重短缺。

四、 待發展的技術與未來計劃前瞻

報告提出了「機器人轉型(RX, Robot Transformation)」的概念,強調整體流程的重新定義:

  • 待發展技術:
    1. 物理 AI(Physical AI): 融合 AI 與物理反饋,提升對環境文脈的理解。
    2. 通訊基盤技術: 強化機器人的「社會性技巧」,包含情感辨識、多語言對話與適應個人特性。
    3. 模組化與追蹤(Traceability): 推動機器人組件的模組化以降低成本,並建立廢棄後回收的生命週期管理。
  • 未來計劃與職業創出: 為了支撐 2050 年的機器人社會,報告預見了多種新興職業,如「機器人友善環境協調員」(優化操作空間)、「機器人業務製作人」(規劃商業模式)及「機器人再生工程師」(循環經濟)。

結語

報告總結指出,日本機器人產業的未來勝負點在於:應對全球要請、實現幸福感(Well-being)以及強化國際競爭力


💡 類比理解: 如果過去的機器人像是工廠裡「低頭拉車的苦力」(專注於效率與替代勞動),那麼 2050 年的機器人將轉變為「與人類結伴而行的嚮導與護衛」。它們不僅能預見危險(基礎設施監測),還能跨越時空障礙(替身機器人),最終目標是讓每個人都能依照自己的步調,在技術的支撐下,走在通往幸福的道路上。

Humanoid 100 : 日本與韓國的主要整合者

 根據來源資料(The Humanoid 100 報告),日本與韓國的整合者(Integrators)在全球人形機器人價值鏈中佔有重要地位,這兩個國家的企業在已確認參與人形機器人開發的全球公司中貢獻顯著。

以下針對您提到的日韓整合者,詳細說明其機器人現狀、趨勢、應用場景及合作夥伴:

1. Toyota (豐田汽車) - 日本

  • 機器人狀況: 豐田開發有 T-HR3Punyo 人形機器人,目前均處於原型階段 (Prototype)
  • 應用場景: 被歸類為通用型 (General Use) 與研究平台。
  • 未來趨勢: 豐田透過其豐田研究院 (TRI) 持續探索機器人如何與人類協作,Punyo 的開發重點在於更靈活的身體接觸與物體操縱技術。
  • 合作夥伴: 在規格表中列出 NVIDIA 為其 AI 合作夥伴。

2. Sony Group (索尼) - 日本

  • 機器人狀況: 索尼曾發表 QRIO 原型機,報告指出索尼目前擁有「一旦確定使用場景,即可迅速製造出人形機器人」的技術能力。
  • 應用場景: 主要聚焦於視覺 (Vision) 與機器人技術的結合。
  • 未來趨勢: 索尼具備強大的感測器技術,其未來的機器人發展可能與其領先的相機與影像感測能力深度整合。
  • 合作夥伴: 索尼本身即是人形機器人價值鏈中「身體/傳感器」的重要供應商。

3. Hyundai (現代汽車) / Boston Dynamics - 韓國

  • 機器人狀況: 現代汽車是 Boston Dynamics 的主要股東,其核心機器人為 Atlas。2024 年發布了電動版 Atlas,目前處於原型階段
  • 應用場景: 定位於工業與物流 (Industrial/Logistics)
  • 未來趨勢: Atlas 被視為具備高度運動能力的代表,電動版的推出反映了人形機器人從液壓驅動轉向更精準、易維護的電力驅動的主流趨勢。
  • 合作夥伴: 規格表中列出 NVIDIA 為其 AI 合作夥伴。

4. Rainbow Robotics - 韓國

  • 機器人狀況: 被視為人形機器人的純粹標的 (Near-Pure Play),已發表 RB-Y1 機器人(2024年)。
  • 應用場景: 專注於工業與物流
  • 未來趨勢: 作為純開發商,其技術迭代速度快,且受益於大股東三星的資源整合。
  • 合作夥伴: 三星電子是其最大股東(持股 35%)。

5. Samsung Electronics (三星電子) - 韓國

  • 機器人狀況: 三星不僅投資 Rainbow Robotics,本身也被列入「大腦」與「整合者」分類。
  • 應用場景: 具備開發人形機器人電子架構與半導體的能力。
  • 未來趨勢: 三星利用其在記憶體 (Memory)代工 (Fab) 及晶片設計上的優勢,為機器人提供高效能算力。
  • 合作夥伴: 除了 Rainbow Robotics,三星也為特斯拉 (Tesla) 的 Hardware 4 生產晶片。

6. LG Electronics (LG 電子) - 韓國

  • 機器人狀況: 據報導正在開發家用人形機器人 (Household humanoids)
  • 應用場景: 鎖定消費者電子與家庭服務場景。
  • 未來趨勢: LG 傾向將人形機器人視為「家庭電子的延伸」,利用其在智慧家電的市佔率進入客廳。
  • 合作夥伴: LG Energy Solution 供應電池給多種機器人使用場景。

7. Naver - 韓國

  • 機器人狀況: 韓國網路巨頭,開發有 Ambidex 人形機器人。
  • 應用場景: 結合其互聯網與 AI 軟體專長,開發具備靈活操縱能力的機器人。
  • 未來趨勢: Naver 利用網路公司的技術背景,推動「具身智慧」在服務領域的應用。

跨區域觀察總結: 日本與韓國的整合者在精密機械組件(如減速器、馬達)與電子架構方面具有領先全球的實力。這些企業正透過與 NVIDIA 等 AI 模型開發商合作,利用「數位分身」(Digital Twins) 進行集體學習,加速機器人從研發實驗室進入實際場景的過程。

Humanoid 100: 人形機器人的大腦

 根據與「人形機器人 100」(Humanoid 100)價值鏈報告,各家大廠與其基礎模型(Foundational Models)在人形機器人領域的發展特色、應用現況與趨勢整理如下:

1. NVIDIA:Project Gr00t

  • 特色應用: NVIDIA 是推動「實體 AI」(Physical AI)的領導者。其 Project Gr00t 是一個專為人形機器人設計的基礎模型,核心能力在於結合其強大的運算與 Omniverse 模擬平台
  • 發展趨勢: NVIDIA 讓機器人能在虛擬的數位分身(Digital Twins)中進行數百萬次試驗,實現「集體學習」。目前已與全球多數主要開發商(如 Apptronik、Agility、Unitree)達成合作。

2. Alphabet:Google Deepmind

  • 特色應用: Google Deepmind 設有專門的機器人小組,致力於將大型語言模型(LLMs)與生成式 AI 技術引入機器人領域。
  • 發展趨勢: 致力於打破機器人與 AI 之間的隔閡(即將「機器控制」與「人工智慧」結合),其模型讓機器人能從孤立的技術進入「AI 飛輪」,加速學習速度。目前也與 Apptronik 展開深度合作。

3. Meta:Llama 與控制模型

  • 特色應用: Meta 利用其 Llama 模型優勢,開發專用於人形機器人控制與戰術感測器(Tactical Sensors)的基礎模型。
  • 發展趨勢: Meta 的研究重點在於將 AI 能力從數位位元(Bits)遷移到物理原子(Atoms),特別是在機器人動作控制與觸覺感知方面的技術重疊與遷移。 (Figure AI 03 改用自行開發的Helix 系統)

4. Microsoft:Figure AI 02支持者

  • 特色應用: Microsoft 主要扮演基礎模型提供者與人形機器人新創公司 Figure AI 的戰略支持者及合作夥伴。
  • 發展趨勢: 透過雲端算力與數據處理能力,支持 Figure 前一代系列機器人的自主化訓練,致力於實現具備自然語言理解能力的通用型機器人。

5. Baidu (百度):與 UBTech 合作

  • 特色應用: 百度內部設有機器人研究小組,並與中國人形機器人領先廠商 UBTech (優必選) 合作,將其 AI 模型整合至機器人「大腦」中。
  • 發展趨勢: 展現出中國在人形機器人供應鏈、地方政府支持及應用場景(如汽車工廠)方面的領先優勢,其產品 Walker S 已在比亞迪(BYD)、蔚來(Nio)等工廠進行測試。

6. Tesla:Optimus (Optimus Gen 2)

  • 特色應用: Tesla 採用垂直整合策略,Optimus 的「機器人大腦」源自其 FSD(全自動駕駛)硬體與軟體架構。Gen 2 配備 50 個自由度,強調通用用途
  • 發展趨勢: Elon Musk 預計 2025 年將有上千台 Optimus 在 Tesla 工廠工作。其長遠目標是將製造成本降至約 2 萬美元,並認為人形機器人最終將成為 Tesla 價值的核心組成部分。

類比理解: 如果人形機器人的發展是一場大賽,NVIDIA 提供的是「最先進的模擬訓練基地與引擎」,Google、Meta 和 Microsoft 則在編寫「最高階的百科全書與教戰手冊」供選手學習;Tesla 和 Figure 則是直接訓練出的「全能型運動員」,差別在於 Tesla 讓運動員共用汽車的導航經驗(FSD),而 Figure 則專攻搬運與組裝等工業競技項目。

Humanoid 100: 人形機器人的軟體組成

如果把人形機器人想像成一個人,基礎模型就是他的「思考與意識」,運動控制算法就是他的「反射與協調性」,類比半導體則是他的「內分泌與體溫調節」,而致動器就是他強壯的「肌肉關節」。

「人形機器人解剖學」(Anatomy of a Humanoid)

我們可以將機器人的各個組件與人類的神經系統功能進行深度對應:

1. 大腦(Cerebrum):基礎模型與 AI 晶片

在機器人中,這相當於負責邏輯思考、語言理解與多模態感知的核心。

  • 基礎模型(Foundational Models): 如 NVIDIA 的 Project Gr00t 或 Meta 的 Llama,賦予機器人理解自然語言、模仿人類動作及感知動態環境的能力。
  • AI 晶片(SoC): 例如 Tesla 的 FSD 晶片或 NVIDIA 的算力平台,負責接收感測器輸入並在邏輯思考後產生指令。這就像大腦皮質處理資訊並做出決策。

2. 小腦(Cerebellum):運動控制系統

小腦在人類中負責協調動作與維持平衡,這與機器人的**運動控制系統(Motion Control System)**角色一致。

  • 精準執行: 運動控制系統接收來自 AI 晶片的指令,並以高精度和穩定性控制關節運作。
  • 即時反饋: 運控系統會將動作的實際狀態即時反饋給 AI 晶片,這與小腦透過本體感覺不斷修正動作的功能非常相似。

3. 自主神經系統(Autonomic Nervous System):類比半導體與熱管理

自主神經負責維持生命運作(如體溫、心跳),而無需大腦有意識地控制。在機器人中,這類比於基礎調節組件

  • 類比半導體(Analog Semis): 這些晶片與感測器配合,負責調節溫度、電氣分配以及馬達驅動器的電流穩定。
  • 熱管理與電源管理: 負責確保電池組、冷卻系統和結構零件(如外殼與骨架)在安全的狀態下運作。

4. 周圍神經與感官:佈線、感測器與致動器

  • 神經纖維(Nerves): 電線與連接器(Wires & Connectors)是機器人的數據與電力傳輸網路,負責將訊號傳遍全身。
  • 感官(Sensory Organs): 感測器(Cameras, Lidar, Force sensors)提供視覺、深度覺與觸覺,讓機器人感知物理世界。
  • 關節與肌肉(Joints/Muscles): 致動器(Actuators)由馬達、螺桿、減速器等組成,將電能轉換為物理動作。

關鍵軟體技術與廠商:

將人形機器人的結構類比為人類神經系統是非常精確的。根據來源資料,這四個部分在機器人價值鏈中分別承擔了決策、協調、監控與執行的角色,具體的關鍵技術與開發廠商整理如下:

1. 大腦 (Cerebrum):基礎模型與 AI 晶片

這部分負責「邏輯思考」、「語言理解」與「高階決策」,是人形機器人自主性的來源。

  • 關鍵技術:
    • 通用生成式 AI 模型 (Foundational Gen-AI Models): 讓機器人能透過大量數據訓練來理解自然語言、模仿人類動作並感知動態環境。
    • 多模態模型 (Multi-modal models, MMMs): 類似於驅動 ChatGPT 的大型語言模型,MMMs 整合視覺、語言與行動,是當前機器人創新的核心驅動力。
  • 主要開發廠商:
    • 基礎模型: NVIDIA (Project Gr00t)、Alphabet (Google Deepmind)、Meta (Llama 與機器人控制模型)、Microsoft (Figure AI 支持者)、Baidu
    • AI 晶片 (SoC): NVIDIAIntelQualcommTesla (FSD 晶片)、Ambarella地平線 (Horizon Robotics)

2. 小腦 (Cerebellum):運動控制系統

這部分負責接收大腦指令,並確保動作能以高精度與高穩定性執行,同時回傳即時狀態。

  • 關鍵技術:
    • 運動控制算法 (Motion Control Algorithms): 整合 AI 算法以提升可擴展性、精度與穩定性,實現自主學習與任務優化。
    • 實體智慧 (Physical Intelligence/AI): 將數位世界的 AI 能力轉化為物理世界的獨立移動與操作能力。
  • 主要開發廠商:
    • 通常由整機整合者 (Integrators) 自行開發核心系統,如 Tesla波士頓動力 (Boston Dynamics/Hyundai)Agility RoboticsUBTech (優必選)Unitree (宇樹科技) 等。

3. 自主神經系統 (Autonomic Nervous System):類比半導體與熱管理

這部分負責調節機器人的內部「生理」平衡,如溫度、電源分配與馬達狀態,確保系統安全運行。

  • 關鍵技術:
    • 電源與散熱管理軟體: 與感測器配合調節電池效率與組件溫度。
    • 信號調節與驅動控制: 透過類比晶片監控速度、位置與電流分配。
  • 主要開發廠商:
    • 德州儀器 (Texas Instruments)恩智浦 (NXP)意法半導體 (ST Micro)英飛凌 (Infineon)瑞薩 (Renesas)安森美 (Onsemi)Allegro MicrosystemsMelexis

4. 周圍神經與感官:佈線、感測器與致動器

這部分負責收集環境數據(感官)並驅動機械關節(肌肉),並利用軟體進行訓練與分析。

  • 關鍵技術:
    • 模擬與虛擬軟體 (Simulation/Digital Twins): 建立虛擬環境(如 NVIDIA Omniverse)讓機器人在部署前進行數百萬次「集體學習」與數位分身訓練。
    • 數據科學與分析軟體: 捕捉並分析邊緣端(機器人本體)收集的海量感測器數據。
  • 主要開發廠商:
    • 模擬軟體: NVIDIASiemens達梭系統 (Dassault Systemes)Hexagon
    • 數據分析: PalantirOracle
    • 感測硬體: Sony Group (視覺)、Keyence (基恩斯)Novanta (ATI) (力覺與力矩)、Intel RealSense

總結來說,目前的發展趨勢正處於「大腦」快速進化的階段,透過 VLA/VLM (多模態模型)虛擬模擬訓練,人形機器人正在縮短研發週期,並朝向能處理複雜任務的通用用途 (General Purpose) 邁進。

Humanoid 100: 人形機器人的關鍵部位成本

 參考2025/2 來自摩根士丹利的研究報告,深入探討了人形機器人全球供應鏈的投資價值,並提出了「Humanoid 100」企業名單。報告詳盡分析了構成機器人「大腦」的人工智慧模型與半導體,以及組成「身體」的感測器、致動器與電池組件。

下載的連結網址:

https://advisor.morganstanley.com/john.howard/documents/field/j/jo/john-howard/The_Humanoid_100_-_Mapping_the_Humanoid_Robot_Value_Chain.pdf

關鍵部分

根據摩根士丹利的分析,人形機器人的總體價值鏈(Humanoid Value Chain)被劃分為三大關鍵部分,:

  1. 大腦(Brain): 主要由半導體和軟體組成,,負責機器人自主運行所需的 AI 模型、訓練和推論能力,。
  2. 身體(Body): 主要由工業零組件組成,,提供實現機器人運動、電力分配、感測和結構所需的零件,例如致動器零件、感測器和電池等,。
  3. 整合者(Integrators): 是指那些正在開發完整人形機器人的公司,或者具備足夠專業知識進行此類開發的公司,。

目前的成本結構(零件別)

根據摩根士丹利對 Tesla Optimus Gen 2 物料清單(BOM)的估計(不含軟體成本),最昂貴的零件類別是感測器,。

Morgan Stanley 估計 Optimus Gen 2 目前(不含軟體)的總物料清單成本約為 5 萬至 6 萬美元,。

以下是主要零件類別及其佔總 BOM(約 5 萬至 6 萬美元)的估計比例:

零件類別 (Product Type)估計成本 (Approximate Cost)佔總 BOM 比例 (Percentage of Total BOM)
感測器 (Sensor)約 20,000 美元37.0%,
馬達 (Motor)約 11,000 美元20.3%,
螺桿 (Screw)約 11,000 美元20.2%,
減速器 (Reducer)約 7,000 美元12.6%,

由此可見,感測器(Sensor)是 Optimus Gen 2 中成本最高的零件,佔總體 BOM 的 37.0%,。這些感測器是人形機器人多模式感知(multimodal perception)的關鍵硬體,包括視覺感測器、力/扭矩感測器、慣性感測器和溫度感測器等,其中力感測器尤為重要,能幫助機器人在各種場景下實現平穩和即時的力調整。

相較之下,機器人的「大腦」硬體(包含 FSD 晶片、其他晶片和相機)估計成本約為 2,000 美元,佔總 BOM 的 3.8%,。

儘管目前 Optimus Gen 2 的估計成本在 5 萬至 6 萬美元之間,但摩根士丹利預計,透過規模化生產、導入 AI 演算法以縮短研發週期,以及利用中國製造的成本效益零件,仍有機會實現執行長 Elon Musk 設定的 Optimus 約 2 萬美元的目標售價,。

目前的成本結構(部位別)

根據來源資料中摩根士丹利對 Tesla Optimus Gen 2 的物料清單(BoM)估計,目前每台機器人的總成本(不含軟體)約為 5 萬至 6 萬美元,。

針對您詢問的身體各部位成本,詳細清單如下(各部位金額與比例係根據來源資料之圖表估算得出):

  • 頭部 (Head):約 2,100 美元,佔總 BoM 的 3.8%,。
    • 包含 FSD 晶片、其他處理晶片、相機等感測硬體,。
  • 頸部 (Neck): 來源資料的成本細分中未獨立列出頸部成本,。由於頭部包含視覺與運算核心,頸部結構可能被併入頭部或肩部計算。
  • 肩膀 (Shoulder):約 7,800 美元,佔總 BoM 的  14.3%,。
    • 配備 6 個旋轉致動器(包含無框力矩馬達、力矩感測器、諧波減速器等)。
  • 手臂 (Arm):合計約 5,900 美元,佔總 BoM 的 10.7%,。
    • 細分為:上臂 (Upper Arm) 約 1,100 美元、肘部 (Elbow) 約 2,600 美元、前臂 (Forearm) 約 2,200 美元,。
  • 雙手 (Hands):約 9,500 美元,佔總 BoM 的 17.2%
    • 包含 12 個致動器(使用空心杯馬達與行星減速器)以及 2 個 6D 力感測器,。
  • 軀幹 (Others/Battery):合計約 800 美元,。
    • 包含電池組 (Battery Pack) 約 300 美元 (0.5%),以及其他結構 (Others,包含骨架、外殼、散熱管理等) 約 500 美元 (0.9%),,。
  • 腰部與臀部/骨盆 (Waist & Pelvis):合計約 7,800 美元,。
    • 細分為:腰部 (Waist) 約 2,600 美元 (4.8%)、骨盆 (Pelvis) 約 5,200 美元 (9.5%),。
  • 腿部 (Legs):合計約 14,600 美元,佔總 BoM 的 26.6%,。
    • 細分為:大腿 (Thigh) 約 7,300 美元、小腿 (Calf) 約 7,300 美元,。
    • 腿部主要使用線性致動器,包含行星滾柱絲槓等高單價零件,。
  • 腳部 (Feet):約 6,700 美元,佔總 BoM 的 12.2%,。

總結洞察: 目前 Optimus Gen 2 成本最高的部分是

(1)上肢   (肩/手臂/手),合計佔比42.2%。

(2)下肢(含大腿/小腿/腳),合計佔比38.8%。