![This illustration photograph taken on October 30, 2023, in Mulhouse, eastern France, shows figurines next to a screen displaying a logo of Google DeepMind, a British-US artificial intelligence research laboratory. (Photo by SEBASTIEN BOZON / AFP) (Photo by SEBASTIEN BOZON/AFP via Getty Images) This illustration photograph taken on October 30, 2023, in Mulhouse, eastern France, shows figurines next to a screen displaying a logo of Google DeepMind, a British-US artificial intelligence research laboratory. (Photo by SEBASTIEN BOZON / AFP) (Photo by SEBASTIEN BOZON/AFP via Getty Images)](https://cdn.statically.io/img/bucket-image.inkmaginecms.com/version/desktop/1/image/2024/07/3d7c9aba-6368-4c93-9db7-9b6ad75161f0.jpg)
![This illustration photograph taken on October 30, 2023, in Mulhouse, eastern France, shows figurines next to a screen displaying a logo of Google DeepMind, a British-US artificial intelligence research laboratory. (Photo by SEBASTIEN BOZON / AFP) (Photo by SEBASTIEN BOZON/AFP via Getty Images) This illustration photograph taken on October 30, 2023, in Mulhouse, eastern France, shows figurines next to a screen displaying a logo of Google DeepMind, a British-US artificial intelligence research laboratory. (Photo by SEBASTIEN BOZON / AFP) (Photo by SEBASTIEN BOZON/AFP via Getty Images)](https://cdn.statically.io/img/bucket-image.inkmaginecms.com/version/desktop/1/image/2024/07/3d7c9aba-6368-4c93-9db7-9b6ad75161f0.jpg)
Google 旗下的人工智慧(AI)研究實驗室 Google DeepMind 最近發表了一項突破性研究,宣稱其新開發的 AI 模型訓練方法可大幅提升訓練速度和能源效率。這項名為 JEST 的新技術號稱能將性能提升 13 倍,同時將能源效率提高 10 倍。這項研究的發表恰逢其時,畢竟關於 AI 資料中心對環境影響的討論正日益升溫。
DeepMind 的 JEST 方法,全稱為聯合範例選擇(joint example selection),其採用了一種與傳統 AI 訓練技術截然不同的簡單方式。傳統方法通常聚焦於單一數據點進行訓練和學習,而 JEST 則是以整批數據為單位進行訓練,結果顯示,透過 JEST 比獨立選擇範例更有效。
具體來說,JEST 首先建立一個小型人工智慧模型,用於評估高品質數據源的品質,並對數據批次進行排序。接著,這個模型會將評分結果與更大規模但品質較低的數據集進行比較。小型 JEST 模型會選出最適合訓練的數據批次,然後再基於這些發現來訓練一個大型模型。
這項研究的論文已經公開,論文內提供了更詳細的研究過程說明和未來展望。
DeepMind 的研究人員在論文中強調,JEST 方法的成功關鍵在於其「能夠將數據選擇過程引導向較小但精心策劃的數據集分布」的能力。研究結果相當亮眼,DeepMind 表示:「我們的方法只需原先 13 分之一的訓練次數和 10 分之一的運算量,就能超越目前最先進的模型。」
![](https://cdn.statically.io/img/bucket-image.inkmaginecms.com/version/desktop/1/image/2024/07/ee63bb23-2bc8-49e1-9c62-aa79c59e035a.jpg)
然而,JEST 系統的成功完全取決於訓練數據的品質。如果沒有經過人工精心策劃的高品質數據集,這種「跳躍式」訓練方法就無法發揮作用。這也意味著,相較於其他方法,JEST 可能更難被業餘愛好者或初階人工智慧開發者掌握,因為策劃初始的高品質訓練數據可能需要專家級的研究技能。
JEST 研究的發表正當其時,因為科技業界和各國政府正開始關注人工智慧的巨大能源需求。2023 年,人工智慧工作相關的耗電量約為 4.3 GW,幾乎相當於中東島國賽普勒斯全國的年度用電量。而且這種趨勢還在加劇:單次使用 ChatGPT 的耗電量是進行一次 Google 搜尋的 10 倍之多,Arm 公司的執行長甚至預測,到 2030 年,人工智慧可能會消耗美國 1/4 的電力。
AI 引爆的用電需求,也讓日本科技巨頭軟銀集團(SoftBank Group)社長孫正義表示,將在美擴大投資發電事業,支援發展生成式 AI 的需求。
高盛也預估,AI 資料中心帶來的新能源需求,60% 將由天然氣滿足、剩餘 40% 將由再生能源來滿足。
目前還不清楚其他主要 AI 公司是否會採用 JEST 方法,以及如何採用。據報導,GPT-4 的訓練成本高達 1 億美元,未來更大型的模型可能很快就會突破 10 億美元大關,因此各公司可能正在積極尋找降低成本的方法。
樂觀派認為,JEST 方法可以在維持現有訓練效率的同時大幅降低能耗,既省錢又環保。但更有可能的是,在資本的驅動下,企業會利用 JEST 方法來維持最大功耗,以追求更快的訓練速度。
責任編輯:Sisley
核稿編輯:Chris
本文初稿為 INSIDE 使用 AI 編撰;快加入 INSIDE Google News 按下追蹤,給你最新、最 IN 的科技新聞!
延伸閱讀:
最新發展: