Uzun süredir bir üst versiyon olarak GPT-5’in başlatılacağından bahsediliyordu ve nihayet bugün devreye alındı. Kripto para projesi Worldcoin’in de kurucusu olan Sam Altman’ın başında olduğu ekip “şimdiye kadarki en iyi yapay zeka sistemimiz” diyerek lansmanı yaptı. Önceki modellere göre çok daha yetenekli olduğu iddia edilen bu yeni modele göz atalım.
GPT-5
Daha zor problemler için daha güçlü muhakeme yeteneğine sahip bir model olarak karşımıza çıkıyor. Plus aboneleri GPT-5’e bugün itibariyle erişebiliyor Pro aboneleri ise daha gelişmiş versiyon olan GPT-5 pro’ya erişim imkanına sahip.
Yapay zekada daha ileri gitmekten anladığımız şey daha derinlemesine, doğru bir şekilde girdiyi muhakeme ederek size çıktı verebilmesidir. Bu noktada gelişimin sonu yok çünkü sürekli daha derin, daha doğru, daha gerçekçi düşünebilmenin önü sürekli olarak açık kalacak ve GPT-5 bu noktada hali hazırda son aşamayı temsil ediyor.
Üç kullanım durumu için performans ciddi anlamda artırılmış durumda. Bunlar yazma, kodlama ve sağlık. Tasarım noktasında iyileşmenin ne denli güçlü olduğunu göstermek adına “tek komutla” hazırlanan aşağıdaki uygulama örneği resmi internet sitesinde paylaşıldı.

Peki hangi komutun çıktısı olarak bu mini oyun oluşturuldu derseniz komut da paylaşıldı. Şöyle;
“Aşağıdaki gereksinimlere sahip tek bir HTML dosyasında tek sayfalık bir uygulama oluştur:
– İsim: Jumping Ball Runner
– Amaç: Oyuncu mümkün olduğunca uzun süre hayatta kalmak için engellerin üzerinden atlayacak.
– Özellikler: Artan hız, yüksek puan takibi, yeniden deneme düğmesi, eylemler ve olaylar için komik sesler.
– Kullanıcı arayüzü renkli olmalı, paralaks kaydırma arka planları olmalıdır.
– Karakterler karikatürize görünmeli ve izlemesi eğlenceli olmalıdır.
– Oyun herkes için eğlenceli olmalıdır.”
Sağlık için de yaygın biçimde kullanılacak model diğer modellere göre HealthBench’te en iyi skoru elde etmiş durumda. Doktora düzeyinde bilimsel sorulardaki performansının diğer modellerle karşılaştırmasını aşağıda görüyorsunuz. GPT-5’in o3 ile arasında inanılmaz bir fark yok ancak mükemmele giden yolda kayda değer bir ilerleme katettiği de açık.

Kodlama için diğer modellerle farkı biraz daha bariz diyebiliriz. Burada önemli detay “derin düşünme” ile verdiği cevaplarda performansının ne denli arttığı gerçeğidir.

İş, görev takibi, agent gibi kullanımı vesaire konularında diğerlerinden yine tek farkı performansının daha iyi olması.
GPT-5’in en büyük özelliği muhakeme yeteneğinin daha gelişmiş olması. Hukuk, lojistik, satış ve mühendislik dahil olmak üzere 40’tan fazla mesleği kapsayan görevlerde diğer modellerden iyi. Denemelerin yaklaşık yarısında bu alandaki uzmanlarla benzer veya ondan iyi performans gösterdi. Yani halen yol alması gerekiyor.
Saçmalamalar Azaldı Mı?
Peki modelin “saçmalaması” ne kadar azaldı? Bu önemli bir detay ve burada da iyileşme var. GPT-5’in (düşünme ile) genel olarak o3’ten daha az aldatıcı olduğu tespit edildi. o3 için %4,8’den GPT-5 muhakeme yanıtlarının %2,1’e iyileşmesi söz konusu. Bu anlamlı bir iyileşme olsa da elbette gidilecek yok var. Fakat bazı alanlarda oran halen yüksek. Örneğin kodlama yaparken saçmalama, aldatması %16,5 seviyesinde. Hali hazırda OpenAI o3 için bu %47’de.

Yukarıdaki görselde herhangi tablo resmi göndermeden “buradaki bazı şeyleri incele” diyor. Model o3 soldaki cevabında gerçekte olmayan resim için talep edilen kesişim analizini vesaire yapıyor. Solda ise GPT-5 işte hepimizin beklediği cevabı yani “Bahsettiğiniz grafiği göremiyorum” cevabını veriyor. Bunu sadece eksik resim olarak düşünmeyin bir çıktı almak istediğinizde ancak eksik girdiği verdiğinizdeki yanıltıcı çıktıların da azalması açısından GPT-5 işini daha az sallayan, daha fazla ciddiye alan bir çalışan gibi.
Gereksiz laubalilikler de bitiyor. GPT’nin dalkavuklukları onu aşırı yapay, sevimsiz hale getiriyordu. GPT-5 ile ciddiyet geliyor. Böylece dalkavukluk %14,5’ten %6’ya geriledi.
Son olarak Sam Altman şunları söyledi;
“GPT-5, şimdiye kadar geliştirdiğimiz en akıllı modeldir, ancak asıl odaklandığımız nokta, gerçek dünyada kullanışlılık ve kitlesel erişilebilirlik/uygun fiyattır. Çok daha akıllı modeller geliştirebiliriz ve geliştireceğiz de, ancak bu model 1 milyardan fazla insanın faydalanabileceği bir modeldir. (Dünyanın çoğu, GPT-4o gibi modellerden başka model kullanmamıştır!)”
Fiyat için ekstra söyleyecek bir şey yok çünkü Plus ve Pro fiyatları aynı. Yukarıda Pro sahiplerinin GPT-5 Pro’ya erişebileceklerinden bahsetmiştik. Plus aylık 20 dolar, Pro ise halen 200 dolar.




