Şimdiye Kadarki En İyi Yapay Zekâ Modeli Araştırıldı: Şampiyon Ne ChatGPT Ne DeepSeek…

19 okunma — 04 Nisan 2025 15:24

uzmanblog

Yapay zekâ dalı her gün biraz daha kızışıyorken yapılan testler, dünyanın en yeterli yapay zekâ modelinin hangisi olduğunu gözler önüne serdi. Elde edilen bulgular, aslında çok da şaşırtıcı değildi.

Google’ın daha çok yeni yapay zekâ modeli Gemini 2.5 Pro, girdiği testlerde öbür modellerden daha güzel sonuçlar elde etti. Üstelik Google Gemini 2.5 Pro ile öteki modeller ortasındaki performans farkı hakikaten etkileyiciydi. Model, kimi testlerde rakiplerinin gerisinde kalmıştı fakat buradaki puan farkı fazla manalı değildi.

Gemini 2.5 Pro, farklı testlerde de daha uygun sonuçlar veriyor!

Google Gemini 2.5 Pro, tek bir testte başarılı değildi. Matematik özelinde bir test olan MathArena’da test edilen model, rakiplerinden çok daha uygun performans gösterdi. Bu modelin puanı yüzde 24,4 olarak kayıtlara geçerken OpenAI, Anthropic ve DeepSeek üzere firmaların piyasaya sürdüğü yapay zekâ modelleri, yüzde 5’i geçemediler. Öte yandan; yapay zekânın bir alanda insanları ne zaman geçtiğini ölçen Humanity’s Last Exam testinde de Gemini 2.5 Pro, rakiplerini geride bırakmıştı.

Tabii bu demek değil ki Gemini 2.5 Pro, tüm alanlarda en âlâ yapay zekâ modeli. Kodlama özelinde bir test olan LiveCodeBench’e giren model, kıyaslamalarda yüzde 70,4 puan aldı. OpenAI’ın o3-mini modeli birebir testte yüzde 74,1 puan almıştı. Tekrar yazılımla ilgili bir test olan SWE-bench’te yüzde 63,8 puan alan Gemini 2.5 Pro, yüzde 70,3 puan alan Claude 3.7 Sonnet’in gerisinde kaldı.