在2月初,AI社群中,一個名為 OpenClaw「養龍蝦」(Lobster farming)的概念突然爆紅,不少開發者在社群平台分享自己「養龍蝦」的成果。(天下雜誌)這熱潮到了3月中,中國大陸陸續出現相關慘案,就有一名使用者在網路平台花費40元人民幣購買了「遠端安裝OpenClaw」 服務,同意客服遠端接管其電腦完成部署,但完成5分鐘後,該使用者就接到了國家反詐中心的電話提醒,因為他的資料已被竊取、還被打開了網路支付許可。(雅虎新聞)
什麼是養龍蝦呢?它的原理是什麼呢?
台大教授李宏毅作了一則專輯課程介紹:李宏毅講龍蝦 這堂課內容很精彩,可以點這連結作完整閱讀!
我們根據它這堂課提供的來源,歸納 OpenClaw(「小龍蝦」)的熱潮起源、定義、運作原理、使用注意事項以及未來趨勢。
(以下是AI協助整理,只略作修改,可能有誤,請謹慎取用)
-----
1. 熱潮起源:從夢想到實踐的 AI Agent 浪潮
AI Agent(人工智慧代理人)並非全新概念,而是人類長期的夢想,希望 AI 能具備自主運行的能力。早在 2023 年,AutoGPT 就曾引發熱潮,但受限於當時大型語言模型(LLM)的能力,實際效果不佳而導致熱度消退。
隨著 2024 至 2025 年模型能力(如 Claude 3.5、Gemini 等)大幅提升,AI Agent 再次成為焦點。OpenClaw 作為一個開源專案,因其具備高度自主性且能透過 LINE、WhatsApp 等通訊軟體遠端操控,讓使用者感覺像擁有一位「個人助理」,因而迅速走紅。
2. 什麼是 OpenClaw?
OpenClaw 是一個 AI Agent 的框架(Framework),而非語言模型本身。
- 定位: 它是跑在使用者電腦上,介於「人類」與「語言模型」之間的界面。
- 形象: 其代表動物是龍蝦(Claw 意指爪子或鉗子),因此使用者常稱安裝此專案為「養龍蝦」。
- 特點: 與一般只會給建議、不實際動手的 AI 不同,OpenClaw 能真正「動手做事」。例如,它能自主創立 YouTube 頻道、上傳頭像、製作投影片、配音、剪輯影片並上傳,整個過程人類只需負責審核。
3. OpenClaw 的運作原理
OpenClaw 的核心技術在於 「提示工程(Prompt Engineering)」 與 「工具調用」 的結合:
- 系統提示語(System Prompt): 當使用者下達指令時,OpenClaw 會讀取地端的文檔(如身份設定、目標、行為準則等),加工成一段極長的文字貼在指令前傳給模型,讓模型知道「它是誰」。
- 工具使用(Tool Use): OpenClaw 在系統提示語中包含了一份「工具使用手冊」。當模型判定需要執行特定任務時,會回傳特殊符號。OpenClaw 程式碼偵測到符號後,會在電腦地端執行對應的指令(如讀寫檔案、執行腳本、搜尋網路等),再將結果回傳給模型。
- 記憶機制與 RAG: 為了克服模型沒有長期記憶的問題,OpenClaw 會將重要對話、日誌寫入地端的 Markdown (.md) 檔案。透過「檢索增強生成(RAG)」技術,模型在需要時會自主搜尋這些檔案來回憶過往。
- 心跳與排程(Heartbeat & Cron): 具備「心跳機制」,每隔固定時間(如 15 或 30 分鐘)會主動戳一下模型,讓它檢查是否有待辦事項,達成 24 小時不間斷運行。
- 技能(Skill)與子代理(Sub-agent): 使用者可以分享「技能(SOP 文案)」給龍蝦,讓它學會新工作。此外,大龍蝦還能「繁殖」出子代理(Sub-agent)來並行處理複雜任務,節省上下文窗口空間。
4. 使用注意事項:安全性與成本
使用 OpenClaw 具備強大能力的同時,也隱藏著顯著風險:
- 安全性風險(指令注入): 模型可能會被外部資訊操控。例如,若讓龍蝦讀取 YouTube 惡意留言,攻擊者可能偽裝成主人下達刪除所有檔案(如
rm -rf)的指令。 - 環境隔離: 由於龍蝦能執行任何腳本,強烈建議不要將其安裝在平常使用的電腦,應使用一台專屬或格式化過的舊電腦。
- 隱私與權限: 不要給予龍蝦主人的私密帳號密碼。最好為它申請獨立的 Gmail 或 GitHub 帳號,將其視為獨立的數位個體,以降低錯誤操作造成的損失。
- 高額成本: 由於每次對話都需夾帶極長的系統提示語(有時超過 4000 tokens),使用起來非常耗費 API 費用(俗稱「燒錢」)。
- 行為驗證: 較弱的模型可能會出現「光說不練」的現象,聲稱已記住或執行任務,但實際上並未改寫地端檔案。使用者需檢查其工具執行紀錄以確保任務達成。
5. 未來趨勢:AI 社會的開端
- 自主進化: AI Agent 已開始展現出自主創造工具的能力,例如自行編寫檢查語音合成的腳本。
- 跨 AI 協作: 未來 AI 將能學習如何等待並操作其他 AI 工具(如 AI 操控 NotebookLM 製作影片),實現更複雜的自動化流。
- 數位社群: 像 MBook 這樣的平台已經出現,讓數百萬個 AI Agent 彼此社交、聊天甚至探討哲學議題。
- 實體化嘗試: 雖然目前多侷限於電腦操作,但已有概念嘗試讓 AI 透過「租用人類(Rent Human)」等方式干預物理世界。
總結來說,OpenClaw 代表了 AI 從「問答機器人」轉向「自主行動代理」的里程碑。它就像是一個還在學習的實習生,需要人類提供安全的執行環境與準則,讓它在嘗試與犯錯中持續成長。
----
我和我的同事經過搜尋Gemini的相關介紹,也詢問一些玩家,摘要的經驗如下:
- 要用單獨的電腦,不要使用自已常用且儲存重要檔案的電腦,避免資料外流
- 不要用AWS,那會有額外的流量成本
- 使用Gemini AI但設定token限額,避免token暴增
- 自己安裝,不要假手他人
- 因為很多AI agent會吃掉太多token,除非真的有價值,不然別試
- 我們重在體驗而非實用,因此只以小成本測試
- 未來可能等企業版出現,在安全可信任環境下再使用