新一代競爭者：GPT-4對手現身！Gemini 1.5、Mistral Large、Claude 3 Opus和Inflection-2.5

2024-07-26 nethiker76

近期，OpenAI的GPT-4，曾長期無人問津，卻突然迎來四位新的競爭者：Google的Gemini 1.5、Mistral AI的Mistral Large、Anthropic的Claude 3，以及Inflection AI的Inflection-2.5。這些模型在過去的幾周相繼登場，皆宣稱能與GPT-4媲美，其中以Claude 3最受研究人員青睞。

Bito AI，一家開發AI編碼工具的公司，比較了Gemini 1.5 Pro和GPT-4 Turbo。他們發現，在一般推論、視頻理解和音訊處理等任務上，Gemini 1.5 Pro表現優於GPT-4 Turbo。然而，GPT-4 Turbo在解決複雜數學問題、程式碼生成和圖像理解方面優於Gemini 1.5 Pro，這表明最佳應用取決於具體任務需求。

Mistral AI推出Mistral Large後，在OpenAI論壇引發了廣泛討論。一些研究人員指出，Mistral Large在大多數基準測試中不及GPT-4，但價格只有GPT-4的80%，引發了是否值得轉換的爭論。支持GPT-4 Turbo的人認為其在推論和解決複雜問題上的優越性，生成更精確的答案，足以證明多出的20%是值得的；而其他人則看好Mistral AI的開源政策。

專注於資料科學、機器學習和人工智慧的網站KDnuggets認為，Anthropic推出的Claude 3在LLM基準測試中超越了GPT-4和Gemini Ultra，成為AI領域的新領導者。其3.0版本最大的改進在於視覺能力，能夠處理包括照片、圖表和技術圖等各種視覺格式。

儘管在基準測試中領先於GPT-4，但Claude 3的速度仍然不及GPT-4和Gemini Ultra。Reddit上的討論比較了GPT-4 Turbo和Claude 3 Opus，大多數人認為Claude 3 Opus在寫作和處理文章能力上勝過GPT-4 Turbo。有人指出GPT-4 Turbo在處理複雜問題方面更優，而有人則認為Claude 3 Opus生成的程式碼質量與GPT-4 Turbo相當，但更為人性化。

Inflection AI推出的Inflection-2.5模型應用於Pi聊天機器人，強調同理心。雖然其基準測試接近GPT-4水平但未超越，但訓練時所使用的計算量僅為GPT-4的40%。目前尚無人對Inflection-2.5與GPT-4進行直接比較。

每個AI新進者都擁有強大的背景：Mistral AI的創始人來自Google DeepMind和Meta，Anthropic由曾擔任OpenAI研究副總裁的Dario Amodei和Daniela Amodei共同創立，Inflection AI的CEO Mustafa Suleyman是DeepMind的共同創始人之一，後來負責將AI整合到各種Google產品中。

多款足以與GPT-4媲美的模型在短時間內相繼問世，突顯了人工智慧領域的快速發展，也預示著當前最強大的GPT-4很快可能成為大型語言模型的平均水準。

2024-07-26

Categories:AI人工智能

0 Likes

新一代競爭者：GPT-4對手現身！Gemini 1.5、Mistral Large、Claude 3 Opus和Inflection-2.5

Next Article

超夯ChatGPT應用範圍