客服專線 : ( 03 ) 402-5153 OR ( 02 )2960-8508 週一~週五(9:00~18:00)

service@uniweb.com.tw

新一代競爭者:GPT-4對手現身!Gemini 1.5、Mistral Large、Claude 3 Opus和Inflection-2.5

新一代競爭者:GPT-4對手現身!Gemini 1.5、Mistral Large、Claude 3 Opus和Inflection-2.5
2024-07-26 nethiker76

期,OpenAI的GPT-4,曾長期無人問津,卻突然迎來四位新的競爭者:Google的Gemini 1.5、Mistral AI的Mistral Large、Anthropic的Claude 3,以及Inflection AI的Inflection-2.5。這些模型在過去的幾周相繼登場,皆宣稱能與GPT-4媲美,其中以Claude 3最受研究人員青睞。

Bito AI,一家開發AI編碼工具的公司,比較了Gemini 1.5 Pro和GPT-4 Turbo。他們發現,在一般推論、視頻理解和音訊處理等任務上,Gemini 1.5 Pro表現優於GPT-4 Turbo。然而,GPT-4 Turbo在解決複雜數學問題、程式碼生成和圖像理解方面優於Gemini 1.5 Pro,這表明最佳應用取決於具體任務需求。

Mistral AI推出Mistral Large後,在OpenAI論壇引發了廣泛討論。一些研究人員指出,Mistral Large在大多數基準測試中不及GPT-4,但價格只有GPT-4的80%,引發了是否值得轉換的爭論。支持GPT-4 Turbo的人認為其在推論和解決複雜問題上的優越性,生成更精確的答案,足以證明多出的20%是值得的;而其他人則看好Mistral AI的開源政策。

專注於資料科學、機器學習和人工智慧的網站KDnuggets認為,Anthropic推出的Claude 3在LLM基準測試中超越了GPT-4和Gemini Ultra,成為AI領域的新領導者。其3.0版本最大的改進在於視覺能力,能夠處理包括照片、圖表和技術圖等各種視覺格式。

儘管在基準測試中領先於GPT-4,但Claude 3的速度仍然不及GPT-4和Gemini Ultra。Reddit上的討論比較了GPT-4 Turbo和Claude 3 Opus,大多數人認為Claude 3 Opus在寫作和處理文章能力上勝過GPT-4 Turbo。有人指出GPT-4 Turbo在處理複雜問題方面更優,而有人則認為Claude 3 Opus生成的程式碼質量與GPT-4 Turbo相當,但更為人性化。

Inflection AI推出的Inflection-2.5模型應用於Pi聊天機器人,強調同理心。雖然其基準測試接近GPT-4水平但未超越,但訓練時所使用的計算量僅為GPT-4的40%。目前尚無人對Inflection-2.5與GPT-4進行直接比較。

每個AI新進者都擁有強大的背景:Mistral AI的創始人來自Google DeepMind和Meta,Anthropic由曾擔任OpenAI研究副總裁的Dario Amodei和Daniela Amodei共同創立,Inflection AI的CEO Mustafa Suleyman是DeepMind的共同創始人之一,後來負責將AI整合到各種Google產品中。

多款足以與GPT-4媲美的模型在短時間內相繼問世,突顯了人工智慧領域的快速發展,也預示著當前最強大的GPT-4很快可能成為大型語言模型的平均水準。