轉載至 – Block Tempo: https://www.blocktempo.com/google-launches-gemma-3-the-most-powerful-ai-model-you-can-run-on-one-gpu/
不讓 DeepSeek、OpenAI 專美於前,Google 12 日推出可以在單一 H100 GPU 或 Google TPU 上運行的地表最強 AI 模型 Gemma 3,性能表現超越了 DeepSeek v3、OpenAI o3-mini 和 Meta 的 Llama3 ,引爆全球關注。
中國人工智慧新創公司 DeepSeek 年初推出開源大型語言模型 DeepSeek V3 和 R1,在 AI 領域打響了「低成本」、「開源」的輕量級模型戰爭,2月 OpenAI 緊急免費推出該公司最具成本效益的輕量級推理模型 o3-mini 應戰。
另一家 AI 巨頭 Google 本週也推出只需「1 個 」H100 晶片就能高效運行,號稱「全球最強單加速器模型」的Gemma 3。該模型也是 Google 開放模型 Gemma 系列中最強大、最新的版本。
透過針對輝達 GPU 和專用 AI 硬體的優化,Gemma 3 能夠在單顆晶片,如輝達的 H100 或 Google 的 TPU 上高效運行。 在 LMArena 基準測試中,Gemma 3 超越了 DeepSeek v3(32 個 H100)、OpenAI o3-mini 和 Meta 的 Llama3(16 個 H100)等競品,是可以在單一 GPU 或 Google TPU 上運行的地表最強模型,發布後迅速引爆全球關注。
Gemma 3 引進多模態
根據 Google 介紹, Gemma 系列模型過去一年以已達到超過 1 億次的下載量,並在「Gemmaverse」中衍生出 6萬多種變體,供開發人員使用,其設計目標是「直接在從手機、筆電到工作站等任何裝置上快速運行」。
最新的 Gemma 3,添加了社群敲碗最多的更長的上下文、多模態等功能,可分析圖像、文字與短影片,支援視覺語言輸入和文字輸出,並理解 140 多種語言,提供改進的的數學、推理和聊天功能。Gemma 3 也提供四種不同的尺寸(1B、4B、12B 和 27B),滿足開發人員的需求。