12/26/25

鴻海科技日(4):Solomon 陳政隆

 【重點整理】

1.機械手臂:最早於1954年問世,1961年由Unimate首次應用於汽車產線,主要執行危險、骯髒、無聊的3D(Dangerous, Dirty, Dull)工作。

2.協作機器人(Collaborative Robot):2010年後出現,可與人互動且不需隔離,安全性較高,能在非封閉空間運作。

3.自走車機器人:2010年後期發展,可移動但智慧有限,依照程式指令行動,缺乏自主智能。

4.Fragmented Intelligence:指機器人與車架手各自有獨立控制器,難以協同運作,功能上分散且不易整合。

5.物理代理人(Physical Agent):由AI教父黃仁勳普及,指能接收指令並執行實體動作的AI代理人,與純數位AI agent有別。

6.VLA模型(Vision Language Action Model):用於人形機器人,結合視覺、語言與動作決策,適應多關節複雜運動,無法用傳統逆向運動學(IK)解決。

7.逆向運動學(Inverse Kinematics, IK):傳統機械手臂控制法則,利用數學矩陣計算每個關節角度達到目標位置。

8.Semantic Understanding:語意理解能力,讓機器人能辨識任務、環境及目標物件,現階段VLM/LLM已進步但VLA仍有限。

9.機器人訓練方法:包括MR眼鏡教學、IMU感測器模仿、以及基於NVIDIA Jetson Thor平臺的自動化教學,三者可組合但訓練時間長。

10.直行程(Execution Pipeline):類似Android OS,串聯機器人理解、感知、行動三個層次,使開發者能以積木式方塊快速設計客製化應用。

11.機器人主流趨勢:輪型機器人下半身穩定,便於用IK控制,上半身可結合VLA應對複雜任務,人形機器人則面臨多軸與學習挑戰。

12.中美機器人競爭:美國軟體(LLM、VLM、VLA)領先但差距縮小,中國硬體進步快,供應鏈成熟且價格迅速下降,市佔率有望持續擴大。


【內容整理】

【機器人歷史回顧與產業演變】

講者回顧了機械手臂自1954年問世至今近70年的發展歷程。最初機械手臂主要應用於工業產線,執行危險、骯髒、無聊的3D工作。日本稱其為3K工作。隨著科技進步,2009至2010年出現協作機器人,其能在非隔離環境下與人互動,大幅提升了安全性與靈活性。2010年後期,自走車機器人問世,使機器人成為可移動的平臺,但智慧仍依賴程式指令而非自主判斷。這些演變反映出機器人產業從單一重複性工作逐漸擴展至多樣化場域,但核心智能尚未突破。


【人形機器人與物理代理人的興起】

近兩年來,人形機器人成為熱門議題。講者指出,人形機器人被期待成為未來最具潛力的物理代理人,其概念由黃仁勳推廣。物理代理人不同於純軟體AI agent,必須能理解指令並執行實體動作。舉例而言,人形機器人在接到「拿杯子」的任務時,需完成環境感知、目標辨識、路徑選擇和精確操作。這一過程模仿人類神經系統的高度整合能力,目前技術尚未達到類人直覺和靈活性。講者強調,人形機器人的設計需考慮人體工學和現有環境的適配性,而非僅僅拼接車架手臂。


【AI、感知與行動串聯的技術挑戰】

講者分析了人形機器人的智能架構,包括對任務的理解(大腦)、環境感知(眼睛)及動作執行(小腦),三者均需依賴AI技術。現階段的人形機器人在視覺感知上仍受限,多數只能處理眼前物件,缺乏完整的空間環境推理能力。此外,其學習速度慢,需要大量重複訓練才能掌握新技能,而且所學技能難以重複利用。語意理解(Semantic Understanding)雖因大型語言模型(LLM/VLM)而提升,但在視覺-語言-動作串聯(VLA)方面仍有明顯瓶頸。


【機器人訓練方法與技術革新】

目前主流的人形機器人訓練方式包含戴MR眼鏡進行教學、利用IMU感測器模仿動作,以及結合NVIDIA Jetson Thor平臺的自動化教學。這些方法雖可提升訓練效率,但仍需耗費大量時間與人工參與。講者分享其團隊在機械手臂領域已能讓機器人在30秒內識別新物件,並正嘗試將此快速學習技術導入VLA模型,以期提升人形機器人的學習速度與適應能力。


【執行平臺與客製化應用開發】

講者介紹直行程(Execution Pipeline)概念,類似Android OS,用於串聯理解、感知與行動三個層次,使開發者能以積木式方塊組合方式快速設計客製化視覺機器人應用。在工業場域中,由於每位客戶需求不同,此種模組化設計有助於因應多元場景並加速產品開發。該團隊正計畫將此平臺拓展至人形機器人領域,使未來用戶僅需下達指令即可自動拆解並執行複雜任務。


【主流趨勢及中美競爭格局】

未來幾年輪型機器人預計成為主流,其下半身結構穩定且便於利用逆向運動學(IK)控制,上半身則可結合VLA模型應對複雜任務。相較之下,人形機器人在多軸控制及學習速度上仍面臨重大挑戰。國際競爭方面,美國在軟體(LLM、VLM、VLA)領域領先,但中國在硬體供應鏈、組件自主研發及價格競爭上進步迅速,加上龐大的製造業基礎,有助於提升產品成熟度與市場滲透率。講者預測,中國未來在人形機器人市場的市佔率將持續擴大。