4/06/26

26157 李宏毅講養龍蝦心得筆記

 在2月初,AI社群中,一個名為 OpenClaw「養龍蝦」(Lobster farming)的概念突然爆紅,不少開發者在社群平台分享自己「養龍蝦」的成果。(天下雜誌)這熱潮到了3月中,中國大陸陸續出現相關慘案,就有一名使用者在網路平台花費40元人民幣購買了「遠端安裝OpenClaw」 服務,同意客服遠端接管其電腦完成部署,但完成5分鐘後,該使用者就接到了國家反詐中心的電話提醒,因為他的資料已被竊取、還被打開了網路支付許可。(雅虎新聞

什麼是養龍蝦呢?它的原理是什麼呢?

台大教授李宏毅作了一則專輯課程介紹:李宏毅講龍蝦  這堂課內容很精彩,可以點這連結作完整閱讀!

我們根據它這堂課提供的來源,歸納 OpenClaw(「小龍蝦」)的熱潮起源、定義、運作原理、使用注意事項以及未來趨勢。

以下是AI協助整理,只略作修改,可能有誤,請謹慎取用

-----

1. 熱潮起源:從夢想到實踐的 AI Agent 浪潮

AI Agent(人工智慧代理人)並非全新概念,而是人類長期的夢想,希望 AI 能具備自主運行的能力。早在 2023 年,AutoGPT 就曾引發熱潮,但受限於當時大型語言模型(LLM)的能力,實際效果不佳而導致熱度消退。

隨著 2024 至 2025 年模型能力(如 Claude 3.5、Gemini 等)大幅提升,AI Agent 再次成為焦點。OpenClaw 作為一個開源專案,因其具備高度自主性且能透過 LINE、WhatsApp 等通訊軟體遠端操控,讓使用者感覺像擁有一位「個人助理」,因而迅速走紅。

2. 什麼是 OpenClaw?

OpenClaw 是一個 AI Agent 的框架(Framework),而非語言模型本身

  • 定位: 它是跑在使用者電腦上,介於「人類」與「語言模型」之間的界面
  • 形象: 其代表動物是龍蝦(Claw 意指爪子或鉗子),因此使用者常稱安裝此專案為「養龍蝦」。
  • 特點: 與一般只會給建議、不實際動手的 AI 不同,OpenClaw 能真正「動手做事」。例如,它能自主創立 YouTube 頻道、上傳頭像、製作投影片、配音、剪輯影片並上傳,整個過程人類只需負責審核。

3. OpenClaw 的運作原理

OpenClaw 的核心技術在於 「提示工程(Prompt Engineering)」 與 「工具調用」 的結合:

  • 系統提示語(System Prompt): 當使用者下達指令時,OpenClaw 會讀取地端的文檔(如身份設定、目標、行為準則等),加工成一段極長的文字貼在指令前傳給模型,讓模型知道「它是誰」。
  • 工具使用(Tool Use): OpenClaw 在系統提示語中包含了一份「工具使用手冊」。當模型判定需要執行特定任務時,會回傳特殊符號。OpenClaw 程式碼偵測到符號後,會在電腦地端執行對應的指令(如讀寫檔案、執行腳本、搜尋網路等),再將結果回傳給模型。
  • 記憶機制與 RAG: 為了克服模型沒有長期記憶的問題,OpenClaw 會將重要對話、日誌寫入地端的 Markdown (.md) 檔案。透過「檢索增強生成(RAG)」技術,模型在需要時會自主搜尋這些檔案來回憶過往。
  • 心跳與排程(Heartbeat & Cron): 具備「心跳機制」,每隔固定時間(如 15 或 30 分鐘)會主動戳一下模型,讓它檢查是否有待辦事項,達成 24 小時不間斷運行。
  • 技能(Skill)與子代理(Sub-agent): 使用者可以分享「技能(SOP 文案)」給龍蝦,讓它學會新工作。此外,大龍蝦還能「繁殖」出子代理(Sub-agent)來並行處理複雜任務,節省上下文窗口空間。

4. 使用注意事項:安全性與成本

使用 OpenClaw 具備強大能力的同時,也隱藏著顯著風險:

  • 安全性風險(指令注入): 模型可能會被外部資訊操控。例如,若讓龍蝦讀取 YouTube 惡意留言,攻擊者可能偽裝成主人下達刪除所有檔案(如 rm -rf)的指令。
  • 環境隔離: 由於龍蝦能執行任何腳本,強烈建議不要將其安裝在平常使用的電腦,應使用一台專屬或格式化過的舊電腦。
  • 隱私與權限: 不要給予龍蝦主人的私密帳號密碼。最好為它申請獨立的 Gmail 或 GitHub 帳號,將其視為獨立的數位個體,以降低錯誤操作造成的損失。
  • 高額成本: 由於每次對話都需夾帶極長的系統提示語(有時超過 4000 tokens),使用起來非常耗費 API 費用(俗稱「燒錢」)。
  • 行為驗證: 較弱的模型可能會出現「光說不練」的現象,聲稱已記住或執行任務,但實際上並未改寫地端檔案。使用者需檢查其工具執行紀錄以確保任務達成。

5. 未來趨勢:AI 社會的開端

  • 自主進化: AI Agent 已開始展現出自主創造工具的能力,例如自行編寫檢查語音合成的腳本。
  • 跨 AI 協作: 未來 AI 將能學習如何等待並操作其他 AI 工具(如 AI 操控 NotebookLM 製作影片),實現更複雜的自動化流。
  • 數位社群: 像 MBook 這樣的平台已經出現,讓數百萬個 AI Agent 彼此社交、聊天甚至探討哲學議題。
  • 實體化嘗試: 雖然目前多侷限於電腦操作,但已有概念嘗試讓 AI 透過「租用人類(Rent Human)」等方式干預物理世界。

總結來說,OpenClaw 代表了 AI 從「問答機器人」轉向「自主行動代理」的里程碑。它就像是一個還在學習的實習生,需要人類提供安全的執行環境與準則,讓它在嘗試與犯錯中持續成長。

----

我和我的同事經過搜尋Gemini的相關介紹,也詢問一些玩家,摘要的經驗如下:

  • 要用單獨的電腦,不要使用自已常用且儲存重要檔案的電腦,避免資料外流
  • 不要用AWS,那會有額外的流量成本
  • 使用Gemini AI但設定token限額,避免token暴增
  • 自己安裝,不要假手他人
  • 因為很多AI agent會吃掉太多token,除非真的有價值,不然別試
  • 我們重在體驗而非實用,因此只以小成本測試
  • 未來可能等企業版出現,在安全可信任環境下再使用