又有新AI模型問世！阿里巴巴發表Qwen 2.5-Max　稱表現上優於DeepSeek V3

新聞

記者洪宗荃／綜合報導

中國國產AI大型語言模型DeepSeek（深度求索）話題持續延燒，不過除了國際矚目之外，國內競爭對手也不甘於後，中國網際網路服務巨頭阿里巴巴，近期也透過旗下的阿里雲，發表了自家的AI語言模型通義千問Qwen 2.5-Max超大規模MoE模型，甚至號稱測試表現上優於DeepSeek V3，而阿里巴巴（BABA：NYSE）的美股股價更是收漲6.71%。

阿里雲近日發表了自家的AI語言模型通義千問Qwen 2.5-Max超大規模MoE模型。（圖／翻攝自微博）

根據了解，該研發團隊指出通義千問Qwen 2.5-Max超大規模MoE模型，使用超過20兆token的預訓練數據，及精心設計的後訓練方案進行訓練，並聲稱可以通過API的方式進行訪問，也可以登錄Qwen Chat進行體驗，例如直接與模型對話，或者使用 artifacts及搜索等功能。

阿里雲跟其他指令模型，包括DeepSeek V3、GPT-4o和Claude-3.5-Sonnet對比性能，在Arena-Hard、LiveBench、LiveCodeBench 和GPQA-Diamond 等基準測試中，Qwen2.5-Max 的表現超越了DeepSeek V3，同時在MMLU-Pro 等其他評估中也展現出了極具競爭力的成績。

阿里雲表示，基準測試中，Qwen2.5-Max 的表現超越了DeepSeek V3。（圖／翻攝自微博）

在基座模型的對比中，由於無法訪問 GPT-4o 和 Claude-3.5-Sonnet 等閉源模型的基座模型，阿里雲將 Qwen2.5-Max 與目前領先的開源 MoE 模型 DeepSeek V3、最大的開源稠密模型 Llama-3.1-405B，以及同樣位列開源稠密模型前列的 Qwen2.5-72B 進行了對比。

阿里雲研發團隊表示，Qwen2.5-Max的基座模型在大多數基準測試中都展現出了顯著的優勢。（圖／翻攝自微博）

根據阿里雲研發團隊表示，Qwen2.5-Max的基座模型在大多數基準測試中都展現出了顯著的優勢。研發團隊也強調，隨著後訓練技術的不斷進步，下一個版本的Qwen2.5-Max將會達到更高的水平。

◎《FTNN新聞網》提醒您：本資料僅供參考，投資人應獨立判斷，審慎評估並自負投資風險。

新聞

又有新AI模型問世！阿里巴巴發表Qwen 2.5-Max　稱表現上優於DeepSeek V3

相關報導

民視

2024打工族十大事件月薪不如時薪？少子化、AI挑戰打工人

2024打工族十大事件月薪不如時薪？少子化、AI挑戰打工人

民視

中國DeepSeek大屠殺！謝金河曝「台股最慘下場」

中國DeepSeek大屠殺！謝金河曝「台股最慘下場」

FTNN

DeepSeek導致輝達股價大波動！他直問「所以AI算力瞬間過剩？」　網：漲跌不需理由

DeepSeek導致輝達股價大波動！他直問「所以AI算力瞬間過剩？」　網：漲跌不需理由

東森新聞

DeepSeek主打低成本美準商務部長：偷來的當然便宜

DeepSeek主打低成本美準商務部長：偷來的當然便宜

又有新AI模型問世！阿里巴巴發表Qwen 2.5-Max 稱表現上優於DeepSeek V3

相關報導

民視

2024打工族十大事件 月薪不如時薪？少子化、AI挑戰打工人

2024打工族十大事件 月薪不如時薪？少子化、AI挑戰打工人

民視

中國DeepSeek大屠殺！謝金河曝「台股最慘下場」

中國DeepSeek大屠殺！謝金河曝「台股最慘下場」

FTNN

DeepSeek導致輝達股價大波動！他直問「所以AI算力瞬間過剩？」 網： 漲跌不需理由

DeepSeek導致輝達股價大波動！他直問「所以AI算力瞬間過剩？」 網： 漲跌不需理由

東森新聞

DeepSeek主打低成本 美準商務部長：偷來的當然便宜

DeepSeek主打低成本 美準商務部長：偷來的當然便宜

又有新AI模型問世！阿里巴巴發表Qwen 2.5-Max　稱表現上優於DeepSeek V3

2024打工族十大事件月薪不如時薪？少子化、AI挑戰打工人

2024打工族十大事件月薪不如時薪？少子化、AI挑戰打工人

DeepSeek導致輝達股價大波動！他直問「所以AI算力瞬間過剩？」　網：漲跌不需理由

DeepSeek導致輝達股價大波動！他直問「所以AI算力瞬間過剩？」　網：漲跌不需理由

DeepSeek主打低成本美準商務部長：偷來的當然便宜

DeepSeek主打低成本美準商務部長：偷來的當然便宜