Gemini 整理與摘要
這部影片是《All-In Podcast》對 Google DeepMind 執行長、2024年諾貝爾化學獎得主戴米斯·哈薩比斯 (Demis Hassabis) 的深度專訪。哈薩比斯在訪談中深入探討了人工智慧(AI)的現狀、未來發展、通用人工智慧(AGI)的實現,以及 AI 如何革命性地改變科學研究與日常生活。
以下是影片內容的詳細摘要(約 1000 字):
1. 諾貝爾獎與 AlphaFold 的意義
訪談開場談到了哈薩比斯獲得諾貝爾獎的經歷。他分享了接到瑞典電話時的震撼感,以及在瑞典參加頒獎典禮、與歷史上眾多偉大科學家(如愛因斯坦、居禮夫人)並列簽名的榮耀 [01:35]。這項獲獎的核心是 AlphaFold,它解決了困擾生物學界 50 年的蛋白質摺疊問題。哈薩比斯強調,這不僅是一個科學突破,更證明了 AI 可以作為加速科學發現的「終極工具」。
2. Google DeepMind 的角色與模型演進
哈薩比斯解釋了 DeepMind 在 Alphabet(Google 母公司)中的定位。目前 DeepMind 已與 Google 的內部 AI 部門合併,成為整個公司的「引擎室」,負責開發 Gemini 等核心模型 [03:03]。
* Gemini:是多模態模型的代表,能處理文字、影像、音訊和視訊,目前已整合進 Google 的各項產品,服務數十億用戶。
* Genie 世界模型:這是一個極具突破性的研究項目。Genie 能夠僅憑文字指令就生成一個可互動的 3D 虛擬世界。這與傳統遊戲引擎(如 Unity)不同,Genie 並未預設物理規則,而是透過觀察數百萬小時的影片,「反向工程」出物理法則(如反射、流體動力學)[06:20]。
3. AGI、機器人學與「物理世界」的理解
哈薩比斯認為,要達到 AGI(通用人工智慧),AI 必須理解物理世界,而不僅僅是處理抽象的文字或數學。
* 機器人學的突破:DeepMind 正在將 Gemini 模型應用於機器人,使其能理解自然語言指令並轉化為肢體動作(如「把黃色物體放入紅桶」)。
* 人形機器人:他預測未來會有「專用機器人」和「人形機器人」並存。人形機器人之所以重要,是因為現有的物理世界(門口、階梯)是為人類設計的,人形構造最能無縫銜接。
* 機器人的「Android 時刻」:Google 正在考慮建立機器人的作業系統(OS)層,讓機器人硬體能像手機一樣快速普及 [11:29]。
4. 通用人工智慧 (AGI) 到底還有多遠?
對於 AGI 的實現時程,哈薩比斯持謹慎樂觀態度,預測大約在 5 到 10 年內 [19:31]。他指出目前 AI 仍缺乏幾項關鍵能力:
* 真正的創造力:目前的 AI 主要是做模式匹配(Pattern Matching),還無法像愛因斯坦那樣做出「直覺性的跨越」或提出全新的科學假設。
* 一致性與推理:今天的模型在處理高中數學或簡單計數時仍會犯錯,這在真正的 AGI 中是不該發生的。
* 持續學習:AI 仍缺乏像人類一樣即時、在線地學習新知識並調整行為的能力。
5. 創意產業的民主化
他討論了 AI 在藝術與影視領域的應用(如影像生成模型 Veo)。AI 正在將創意工具「民主化」,讓普通人能透過說話來編輯照片或製作影片。同時,頂尖創意人(如導演戴倫·艾洛諾夫斯基)正利用這些工具將生產力提高 10 到 100 倍,探索全新的敘事方式。未來可能出現一種「共同創作」的新娛樂形式,用戶與頂尖創意家共同構建動態故事 [23:54]。
6. 醫藥研發與能源挑戰
哈薩比斯創辦了 Isomorphic Labs,目標是利用 AI 徹底縮短藥物研發週期。
* 藥物開發:透過模擬蛋白質與化學分子的相互作用,目標是將長達 10 年的開發期縮短至幾週或幾天 [25:21]。
* 能源消耗:針對 AI 巨大的能源需求,他持樂觀看法。雖然模型規模在擴大,但推論效率已提升了 10 到 100 倍。更重要的是,AI 未來能幫助優化電網、設計新材料和開發新能源,其對氣候與能源的正面貢獻將遠超其消耗 [30:41]。
結語:下一個黃金時代
哈薩比斯總結道,未來 10 年 AI 將開啟一個科學的「新文藝復興時期」。如果能正確引導 AGI 的發展,人類將在能源、健康和科學理解上迎來前所未有的黃金時代。
影片連結:https://www.youtube.com/watch?v=Kr3Sh2PKA8Y