記者莊蕙如/綜合報導
中國AI新創DeepSeek近日以突破性的運算技術震撼業界,其模型以更低成本運行,讓AI訓練成本直接降至十分之一,對高階AI晶片產業帶來衝擊。精神科醫師沈政男指出,DeepSeek之所以能顯著減少晶片需求,關鍵在於它省略了「價值函數」的訓練步驟,而這正是OpenAI技術上的一大弱點。
![](https://i01.ftnn.com.tw/a/25/028/2502818421620484773ec4.jpg)
沈政男日前在社群發文分析,從DeepSeek團隊發表的論文來看,其模型的運算方式之所以更節能,核心在於省略「價值函數」訓練這一環節。
沈政男提到,AI學習的基本原理是透過大量訓練資料來調整參數,從錯誤中找到最佳解決方案。例如AlphaGo所使用的蒙地卡羅方法,便是讓電腦隨機走棋,再根據勝率推演最優步驟。而另一種常見的策略馬可夫鏈,則是依據前一步的狀態,計算出最可能的最佳行動。
沈政男說,目前OpenAI採用的PPO演算法(近端策略優化,Proximal Policy Optimization),則進一步透過「價值函數」來評估每一步的效果,形成所謂的一般優勢估計(Generalized Advantage Estimation, GAE)。這種方法雖然能提升策略優化效果,但缺點是需要大量晶片資源進行計算,就像老師必須對每位學生的每一次考試都進行個別評估一樣,極為耗費資源。
而關於DeepSeek,沈政男則表示它的做法則完全不同,它不依賴價值函數,不需要像OpenAI那樣逐一評估每個輸出結果,而是透過「群體比較」來決定最佳學習策略。簡單來說,就像一個班級裡,不是針對每個學生單獨評分,而是觀察全體的學習成果,當某種教學方法有效時,整體表現會提升,每個學生與平均值的差距也會縮小。這樣的策略讓DeepSeek能夠在不犧牲學習效果的情況下,大幅降低運算資源消耗。
沈政男直言,中國的AI技術已經穩坐全球第二強,正加速追趕美國。與製藥、汽車產業不同,AI主要是「腦力競賽」,不需長期技術積累與硬體基礎,因此中國的發展速度更為驚人。至於台灣,受限於資源與市場規模,較難在這場競賽中與美中抗衡。
儘管AI技術進步迅速,沈政男強調,目前AI仍然無法真正「自我評價」,仍需人類介入指導。然而,DeepSeek的創新之處就在於,它已經開始透過「自我評價」機制來調整學習步驟,這種方法更接近人腦的學習模式,為AI技術發展開啟新的可能性。
而關於DeepSeek,沈政男則表示它的做法則完全不同,它不依賴價值函數,不需要像OpenAI那樣逐一評估每個輸出結果,而是透過「群體比較」來決定最佳學習策略。簡單來說,就像一個班級裡,不是針對每個學生單獨評分,而是觀察全體的學習成果,當某種教學方法有效時,整體表現會提升,每個學生與平均值的差距也會縮小。這樣的策略讓DeepSeek能夠在不犧牲學習效果的情況下,大幅降低運算資源消耗。
沈政男直言,中國的AI技術已經穩坐全球第二強,正加速追趕美國。與製藥、汽車產業不同,AI主要是「腦力競賽」,不需長期技術積累與硬體基礎,因此中國的發展速度更為驚人。至於台灣,受限於資源與市場規模,較難在這場競賽中與美中抗衡。
儘管AI技術進步迅速,沈政男強調,目前AI仍然無法真正「自我評價」,仍需人類介入指導。然而,DeepSeek的創新之處就在於,它已經開始透過「自我評價」機制來調整學習步驟,這種方法更接近人腦的學習模式,為AI技術發展開啟新的可能性。
更多FTNN新聞網報導
DeepSeek危機變轉機?ASML CEO:低成本AI模型將擴大市場需求
DeepSeek安全性衝擊個資!惡意程式恐「竊取信用卡、個人隱私資料」 網路威脅情報公司發聲了
DeepSeek超低成本AI揭密?OpenAI內部爆料:疑似盜用GPT-4模型