[轉載] 阿里AI大模型效能大躍進 「通義千問」新版本性能優於DeepSeek

以下轉載自:https://udn.com/news/story/7240/8591507?from=udn_ch2_menu_v2_main_index

阿里AI大模型效能大躍進,旗下阿里雲開發出性能比DeepSeek-R1更強大的超強推理開源模型「通義千問QwQ-32B」,但成本較DeepSeek-R1低九成、參數量更大減95%,甚至在消費級顯卡上,就能實現本地部署,大搶邊緣AI運算商機。

 

阿里雲為大陸雲端服務供應商(CSP)龍頭,也是助威蘋果衝刺大陸AI市場的關鍵戰略夥伴,挾自家龐大既有用戶與蘋果果粉基礎,可望刺激AI需求水漲船高,點燃AI伺服器需求引擎。英業達為阿里雲主力AI伺服器代工廠,將坐享商機。

 

阿里雲指出,QwQ-32B為擁有32億參數的模型,性能與具備6,710億參數的DeepSeek-R1媲美,甚至在某些測試中超越DeepSeek-R1。

 

阿里雲表示,QwQ-32B極強推理能力與更低的資源消耗需求,關鍵在於採用大規模強化學習(RL)技術,並整合AI代理(AI Agent)相關能力,能在使用工具的同時進行批判性思考,並根據環境回饋調整推理過程。

 

阿里雲在大陸雲端運算市場市占率最高,自主研發開源大模型「通義千問」系列,從2023年8月起,通義千問相繼開源Qwen、Qwen1.5、Qwen2、Qwen2.5等四代模型,衍生模型超過9萬個。

 

阿里巴巴集團執行長吳泳銘2月時宣布,未來三年將投入逾人民幣3,800億元(約新台幣1.72兆元),用於建設雲端和AI硬體基礎設施,總額超過過去十年總和。

 

業界人士看好,阿里雲市占率達36%,穩居大陸CSP廠領先地位,並持續斥鉅資投入AI基礎建設,同時也是蘋果衝刺大陸AI服務的戰略夥伴,隨著蘋果大陸銷售的iPhone將導入阿里AI模型服務,也將催動AI伺服器建置需求升溫。