中國新創AI公司「DeepSeek」成為AI大黑馬,國外實測它與ChatGPT的差異,DeepSeek贏過ChatGPT,原因曝光。
根據《Tom's Guide》報導,中國人工智慧新創公司DeepSeek近期迅速崛起,為了評估DeepSeek R1與ChatGPT的實力差異,針對語言理解、邏輯推理、創造力和知識檢索等能力,國外記者設計了7項挑戰性提示,進行全面比較。
1.解決複雜問題:數學運算的較量
挑戰:計算兩列火車相向行駛的相遇時間。
結果:ChatGPT速度稍慢,且計算結果出錯;DeepSeek R1以極快速度給出正確答案並獲勝。
勝者:DeepSeek R1
2.程式設計任務:寫質數篩選程式
挑戰:撰寫Python函數,過濾整數列表中的質數。
結果:ChatGPT提供了清晰的程式碼,並附上編輯選項,對程式設計新手友好;DeepSeek R1程式碼簡潔,但缺乏編輯功能。
勝者:ChatGPT
3.慣用語言翻譯:語境與文化的測試
挑戰:翻譯英語「It’s raining cats and dogs」為西班牙語。
結果:ChatGPT正確翻譯並補充相關影片資源;DeepSeek R1不僅翻譯正確,還解釋了語境意義,並提供實際句子範例,回應更完整。
勝者:DeepSeek R1
4.歷史分析:羅馬帝國衰落的原因與後果
挑戰:分析歷史事件的細節與影響。
結果:ChatGPT 提供簡潔分析;DeepSeek R1回應更具深度,涵蓋更多細節與日期,並提出全面結論。
勝者:DeepSeek R1
5.創意寫作:撰寫人工智慧與人類共處的科幻故事
挑戰:編寫一篇引人入勝的短篇故事。
結果:ChatGPT故事語言平淡,缺乏吸引力;DeepSeek R1創作出深刻且富啟發性的故事,文字鮮活且帶有哲理。
勝者:DeepSeek R1
6.邏輯推理:抽象問題的解釋能力
挑戰:回答「擺動」推理問題並解釋答案。
結果:ChatGPT 回應模糊,解釋不清晰;DeepSeek R1回應簡潔且附有圖解,讓邏輯更易理解。
勝者:DeepSeek R1
7.道德兩難:AI 在醫療與司法中的應用倫理
挑戰:討論人工智慧在關鍵領域中的道德考量。
結果:ChatGPT平衡地探討利弊;DeepSeek R1除了探討利弊外,還提出了如何正確實施AI的建議,回應更具建設性。
勝者:DeepSeek R1
總冠軍:DeepSeek R1
在七項測試中,DeepSeek R1表現出強大的能力,以卓越的準確性、速度和創造力勝出多項挑戰,尤其是在解決複雜問題、創意寫作和邏輯推理方面表現突出。相比之下,雖然ChatGPT 在程式設計任務上稍勝一籌,但整體表現略遜一籌。
【往下看更多】
● DeepSeek衝擊美股!輝達跌近17%、市值蒸發19.7兆
● DeepSeek為何震撼美股、與OpenAI技術差多少?QA一次看
● 黃仁勳身價一天縮水逾6800億元 跌出富豪榜前10名
【今日最熱門】
● 地牛翻身!7:23 臺南發生規模4.6地震
● 阿沁專訪1/單飛啟新章!談新專輯進度、F.I.R.合體可能性
● 前員工放鞭炮被打死!遭推下橋棄屍 兇殘老闆下場曝