FacebookTeknoloji HaberleriYoutube

Gemini 3’ün Saltanatı Kısa Sürdü: Claude Opus 4.5 Tanıtıldı

Gemini 3’ün krallığı kısa sürdü: Claude Opus 4.5 tanıtıldı



Tam Boyutta Gör




Yapay zeka sahasındaki “en iyi” unvanları sürekli evriliyor fakat değişmeyen tek şey gelişimin devamlılığı. Anthropic, Claude Opus 4.5 isimli yeni üst düzey modelini tanıtarak, yazılım geliştirme, ajan sistemleri ve bilgisayar kullanımı gibi alanlarda kapsamlı bir güncelleme sağladı. Şirket, bu modelin belirlenen alanlarda şimdiye kadarki en güçlü performansı gösterdiğini ve önceki sürümlerin ötesinde bir teknik kapasiteye ulaştığını belirtiyor.

“En iyi” mücadelesi hız kesmiyor

Gemini 3’ün krallığı kısa sürdü: Claude Opus 4.5 tanıtıldı

Yeni model, yazılım odaklı değerlendirmelerde dikkat çekiyor. SWE-Bench Verified testinde yüzde 80,9 ile en yüksek skora ulaşan Opus 4.5, hem Gemini 3.0 hem de GPT‑5.1‑Codex‑Max modellerini geride bırakıyor. Şirket ayrıca, modelin sadece sentetik testlerde değil, derin araştırma, slayt düzenleme ve elektronik tablo işleme gibi gerçek dünya uygulamalarında da belirgin bir iyileşme sergilediğini vurguluyor.

Gemini 3’ün krallığı kısa sürdü: Claude Opus 4.5 tanıtıldı

Model, Terminal-bench, araç kullanımı testleri tau2-bench ve MCP Atlas, genel problem çözme alanı ARC-AGI 2 ile GPQA Diamond testlerinde de üstün sonuçlar elde ediyor. Anthropic, bilgisayar ve elektronik tablo yeteneklerini de vurguladı ve bunun için paralel ürünler geliştirdi. Bilindiği gibi Claude for Chrome ve Claude for Excel, önceki pilot sunumlar arasındaydı. Opus 4.5 ile birlikte bu ürünler daha geniş bir kullanıcı kitlesine erişim sağlayacak. Chrome uzantısı tüm Max kullanıcılarına açılacak, Excel odaklı model ise Max, Team ve Enterprise kullanıcılarına sunulacak.

Opus 4.5, uzun bağlamlı işlemler için hafıza yönetiminde önemli yenilikler barındırıyor. Bu güncellemeler, uzun sohbetler ve karmaşık görevlerde etkinliği artırıyor.

Şirket, Opus 4.5’in yalnızca yeteneklerinin değil, güvenlik çerçevesinin de genişletildiğini ifade ediyor. Yeni sürüm, kullanım politikalarına aykırı kötü niyetli komutları ayırt etme konusunda önceki sürümlere göre daha dirençli. Opus 4.5, yakın zamanda tanıtılan diğer ileri düzey modellerle ciddi rekabet içinde olacaktır. Bunlar arasında OpenAI’nin GPT-5.1 (12 Kasım’da sunuldu) ve Google’ın Gemini 3 (18 Kasım’da tanıtıldı) modelleri öne çıkıyor.