Attendees look at mobile devices during a product launch event for the Google Pixel 8, and Pixel 8 pro phones, Pixel Watch 2, and Pixel Buds Pro earbuds, in New York on October 4, 2023. (Photo by Ed JONES / AFP) (Photo by ED JONES/AFP via Getty Images) — AFP via Getty Images

人工智慧

Gemini Nano 記憶體需求超大，能塞進非旗艦手機嗎？Android 團隊解釋了

Sisley

2024/05/23
Google 、記憶體、 Andorid 、 Gemini 、 Gemini Nano 、 RAM

目前像是 Gemini Nano 這樣的模型，即便已經足夠輕量，但對於「手機」而言卻仍是非常巨大且消耗記憶體的存在，有什麼技術可以讓 AI 進入到非旗艦的普通手機中呢？

還記得今年 3 月，Google 工程師曾經表示旗下 Pixel 8 無法支援 Gemini Nano，後來又「改口」可以支援該模型一事嗎？這背後轉變的可能原因，Android 團隊解釋了。

在上週的 Google I/O 會後，Android 工程部門副總裁 Dave Burke 在接受媒體訪問時，透露了這點。

當時 Google 工程師 Terence Zhan 曾表示，由於硬體上的限制，Pixel 8 無法支援 Gemini Nano，但他並沒有透露太多硬體上的細節。而 Pixel 8 和 Pixel 8 Pro 的差別在於其 RAM 的容量，分別為 8 GB 與 12 GB，因此「記憶體資源」很可能就是關鍵。

Burke 對此解釋，最初的 Gemini Nano 是 18 億參數的模型，大約需要 1.1 至 1.2GB 的記憶體才能在設備上執行，新的模型已經更大，參數規模來到 38 億，因此需要 4GB 的 RAM，「那是很多的記憶體。對於一般設備來說，這是很大的記憶體需求。」

因此 Burke 也承認，現在的 Gemini Nano 多模態版本，真的是為那些非常旗艦的頂級設備量身打造的，而這些手機的 RAM 通常達到 12GB 到 16GB。

那麼 Google 要如何把 Gemini Nano 放至其他等級的 Android 手機中呢？Burke 表示，就連 18 個月前，Google 自己也認為要在設備上運行 Gemini Nano 是不可能的，不過由於在研究領域已經有了相當大的進展，這也化當初的不可能為可能。

他提到的第一個方法是知識蒸餾（distillation），讓最大的語言模型 Gemini 像是「老師」一樣，教導、訓練一個「學生」模型，也就是 Gemini Nano，而其中很酷的是，Gemini 從一開始就是採多模態設計的 transformer 模型，結果發現，帶有多模態能力的 Gemini Nano 在 Benchmarks 測試上能達到完整 Gemini 模型約 80% 的表現，這也代表壓縮的效果非常好。

除了知識蒸餾之外，Google 也採取了其他方法來縮小模型，比如 38 億個權重（weights），過去通常會用 16 位元來儲存每個權重，但透過模型壓縮技術，可以在設備上將權重壓縮，具體來說，相比過去的 16 位元，他們會把權重壓縮至只用 4 位元或 2 位元來儲存。

他也提到了當前研究的另一個熱點，就是嘗試在 transformer 模型中引入「稀疏性」（sparsity）。 transformer 模型本身是一個密集互連的神經網絡，引入稀疏性的目的，則是要在不顯著損失性能的情況下，將這種網絡分解為更小的獨立部分，將龐大的網絡，分解為更小的子模組，以減少計算量和記憶體需求，術語「混合專家」（mixture of experts，MoE）就是這類的方法之一。

這種概念就是將一個密集互連的神經網絡拆分成較小的混合專家模組，當模型在做推論時，只需要透過其中一個小的專家模組輸出就好，避免全都開始計算，因而減少計算量；另一種優化技術叫做早期退出（early exits），概念是當模型已足夠確信預測結果（確信能預測下一個字）時，就可以提前退出而不執行剩餘的模型層，省去沒必要的計算。

Burke 認為，透過這些壓縮和優化技術，未來還會有更多類似的創新來縮小模型，「我認為隨著時間推移，我們將能在手機中獲得更高品質但更小巧的模型」。

核稿編輯：Jocelyn

延伸閱讀：

品牌

【圖解】領航綠色金融，富邦金控以四大專案打造永續方舟

廣編企劃

2024/07/12
富邦金控、綠色金融、低碳轉型、永續金融、 AI防詐、富邦金控永續報告書2024

全球永續浪潮持續發展，企業扮演了重要的角色，富邦金控一直以來致力於推動永續經營，從防詐、路跑植樹、友善家庭、低碳未來等面向，持續領航綠色金融，打造永續未來。

全球永續浪潮持續發展，企業扮演的角色至關重要，舉例而言，為實現《巴黎協定》將升溫控制在1.5度的目標的氣候行動，必須同時兼顧社會公平和經濟機會永續轉型才能成功，而金融機構引導資金流向，並因其資源、創新能力、經濟影響力和社會責任等多方面的優勢，可成為推動永續的重要力量。

作為金融業領導企業及WEF首家台灣金融業會員，富邦金控積極推動多項創新專案，透過2021年重新擬定的ESG願景工程四大策略「低碳、數位、��影響」，在永續金融、低碳營運、淨零倡議、金融安全、普惠金融等五大面向上，積極落實「正向力量成就可能™」的品牌精神，透過今年甫發布的2023年永續報告書中的四大重點專案，也可一探富邦金控的卓越永續精神展現。

讓AI當防詐守門員——「鷹眼識詐聯盟」

內政部警政署刑事警察局統計，2023年全台詐欺犯罪共3.8萬件，其中以「投資詐欺」件數年增最多，增幅近8成。為了幫助民眾把關金融帳戶安全，自2022年起，北富銀開發「鷹眼識詐模型」，整合全國詐騙態樣並涵蓋100多種動態交易風險特徵，透過可疑交易判斷、帳戶風險評分兩大功能，精準預測異常交易活動的效果。

想要有效防詐，以往必須仰賴真人審核把關，但每個月的交易報表高達6萬份，就算每天3點半後進行審查，也很難及時阻擋詐騙交易的發生。透過善用AI人工智慧與機器學習兩大科技，能預先透過AI當守門員，從每月6萬多份報表中偵查異常，初篩出100多件異常個案，再轉交「真人同事」審視，不僅讓人工審閱工作量銳減99%，且AI初篩的異常個案中，有高達 98% 證實為警示帳戶。

除此之外，富邦更進一步技術共享，產官攜手反詐，全臺將有超過4,300個金融據點被「鷹眼模型」保障覆蓋，根據最新資料統計，這項技術已經成功提前攔阻848個詐騙帳戶，攔阻金額達3,391萬。富邦金控號召了33家銀行共同參與，顯示出其在金融科技防詐領域的領導地位。

透過鷹眼識詐聯盟，體現富邦金控「影響」、「數位」兩大永續核心，提供創新服務與體驗，並以正向力量擴大社會影響力。

越跑越環保—— Run For Green™ 線上大串連

你有想過，跑步也可以同時為永續盡一份心力嗎？自2021年起，富邦金控攜手八大縣市政府推行「Run For Green™」倡議計畫，結合四大馬拉松（臺北馬拉松、萬金石馬拉松、高雄富邦馬拉松、田中馬拉松）及指定賽事，跑者累積跑40公里即可為臺灣種下一棵樹，預估減碳近4,000公噸，

不僅如此，富邦要更進一步，今年，富邦創新推出「富邦 Run For Green™ 全民線上跑」，透過Garmin等穿戴裝置或Strava等跑步紀錄APP，跑者可在日常生活中累計公里數，完成40公里即可線上領取富邦為其種下的一棵樹！

富邦金控不僅是唯一贊助四大馬拉松的金融業者，更已連續十五年榮獲體育推手獎肯定，戮力實踐永續策略「影響」之目標，為守護臺灣生態盡一份心力。

友善家庭最給力——年投入逾1億元生育補助

高齡少子化已成為全球議題，臺灣生育率持續下降，為減緩員工生育、育兒壓力，並善盡企業社會責任，富邦金控遵循「激勵」策略的精神，持續推動全方位的員工照護，打造友善育兒之職場環境，並提供員工優於法令的生育補助，包括：每胎新生兒補助10萬元、6歲以下子女每年補助育兒津貼1.5萬元等，另有提供優於法規的10週全薪產假、8天陪產檢及陪產假等，讓員工產後能獲得充分的休息與陪伴，同時可有更充裕的時間適應育兒新生活。

透過長期不間斷地努力，2023年，富邦金控及子公司迎接了716名富邦寶寶，粗出生率千分之19，是臺灣平均粗出生率的3.3倍；總計年投入逾1億元生育補助，照顧近5000名員工子女，顯示出富邦金控對員工家庭的關懷和支持，不僅於去年榮獲《親子天下》雜誌首屆「友善家庭職場獎」之肯定，今年再獲臺北市政府首屆「友善育兒事業獎」殊榮，成功打造友善健康之幸福職場。

扮演綠色金融加速器——2030年預計達到2.91兆元

��僅對於用戶及內部員工達成永續承諾，富邦金控更深耕金融本業之影響力，透過投、融資引領企業客戶重視環境、低碳轉型，為國內首家積極承諾限制投資碳排敏感性產業的金融機構，並首次將碳排敏感性產業之投融資管理明定於「富邦金融控股股份有限公司暨子公司永續金融政策」，供子公司一致性遵循，持續檢視產業准入及撤資標準。

● 富邦人壽：以母公司富邦金控四大永續策略為核心，從本業出發，實踐綠色保險服務，運用MID身分認證推動行動投保及視訊投保，落實投保無紙化，並推動電子保單、電子通知單及行動保全等數位服務。

● 富邦投信：與富邦人壽皆參與CA100＋議合小組，與成員共同推動淨零排放行動，另在投資面設定長期脫碳投資組合之目標，並針對投資於國內股票之主動式操作基金與全權委託帳戶，率先設定投資組合每單位投資金額碳排減量目標：20223至2025年投資組合每單位投資金額碳排量較2022年（基準年）相比，逐年下降8%、10％及12％。

● 台北富邦銀行：自2021年啟動「Think ESG」計畫，並於2022年起舉辦「Think ESG大師論壇」，開創ESG的創意激盪和金融創新實踐。針對中小企業也舉辦相關ESG講座，針對超過2千家中小企業客戶進行ESG需求調查。

● 富邦產險：富邦產險為國內首家承諾「2050淨零承保」的產險公司，承諾未來不再承保煤炭開採／相關基礎建設、燃煤發電、非典型油氣產業中未有具體減碳行動或低碳轉型計畫的廠商。

● 富邦證券：領先同業推出整合性「ESG專區」，提供包括台股、美股、海外債及基金等四大投資商品ESG評分。透過IPO輔導，藉由持續關注、出席股東會、行使投票權、建設性對話等作為，鼓勵企業擬訂永續發展與淨零轉型的計畫與具體行動方案，參與八件綠色債券承銷案，參與率達73%。

富邦金控在綠色營運面即持續導入綠電，2023年促使國內已導入綠電之據點數占比達17%，由單點購電邁入「全面部署，分批實現」嶄新里程；更持續以金融力量��動��業��碳轉型，2023年全年綠色金融投融資金額達2.57兆元，且不止步於此，富邦持續扮演「轉型催化劑」，設定2030年綠色金融達2.91兆元之目標。

以金融的力量實踐，帶動產業永續轉型的使命

富邦金控董事長蔡明興表示，2023年被視為檢視全球永續行動成績關鍵的一年，COP28凸顯了金融業在低碳轉型中的重要角色，世界經濟論壇在2024年發表的《全球風險調查》也強調了企業永續策略的重要性。富邦金控將繼續追求永續金融創新和跨領域合作，以「正向力量成就可能™」，匯聚正向力量，領跑綠色金融，帶動產業轉型，共同實現永續臺灣的願景。

暸解更多：《富邦金控 2023永續報告書》

Gemini Nano 記憶體需求超大，能塞進非旗艦手機嗎？Android 團隊解釋了

【圖解】領航綠色金融，富邦金控以四大專案打造永續方舟

讓AI當防詐守門員——「鷹眼識詐聯盟」

越跑越環保—— Run For Green™ 線上大串連

友善家庭最給力——年投入逾1億元生育補助

扮演綠色金融加速器——2030年預計達到2.91兆元

以金融的力量實踐，帶動產業永續轉型的使命

【Web3 元觀察】穩定幣的機會與挑戰：為何在 2024 年仍是焦點？

【Web3 元觀察】日本穩定幣法案周年回顧與展望

【Web3 元觀察】加密貨幣的牛市真的來了嗎？價格 v.s. 價值

【Web3 元觀察】探索 2024 年：加密消費者應用的未來發展

【Web3 元觀察】2024 年，「AI + Web3」值得關注的四大領域

最新科學發現：南北極冰層融化會使地球自轉變慢，導致白天變長

聯合國估計：2080 年代全球人口將增長至 103 億，數量在 21 世紀達頂峰

波音 6 月僅售出 3 架客機，上半年總銷售量滑降 70%

不只人工智慧之父，你知道圖靈還是世界首位電腦演奏家嗎？

亞馬遜終止 Astro 機器人商用版發展規劃，未來重心集中在家用版本

中指通：百萬 YouTuber 暨成人內容推廣師 | 競爭激烈、政策緊縮下的求生之道【塞掐 Side Chat】E251

專訪 Neuchips 創鑫：台灣新創怎緊抓生成式 AI 大浪？

黃明志破億神曲《東京盆踊》背後的男人，��訪 Cool Japan TV 共同創辦人林良升

奇軒 Tricking 登台灣 No.1 千萬級 YouTuber！他如何發揮自我、走向世界？

黃仁勳：計算機時代已逝下一個黃金賽道是生命科學

Threads 一週年：一個文字友好的社交場所，找到了它的受眾

馬斯克為何悄悄撤告 Open AI，背後可能有哪些考量？

AI for the rest of us：蘋果打出的漂亮一仗，並沒有違背賈��斯的理想

Google I/O 2024：「Google」的意義，或許已不再是搜尋了

9 種你無論如何都不該對主管說的話