ABD’nin en büyük yapay zeka oyuncusu OpenAI 2022 sonundaki ChatGPT ile yapay zekanın büyüme startını verdi. Normal kullanıcılar yapay zekanın elle tutulup gözle görülen bir şey olduğunu onunla gördü ve binlerce yeni AI ürünü OpenAI’ın açtığı yoldan yürüyerek piyasaya girdi. Şimdi Sam Altman’ın başında olduğu şirket en yeni ve iyi versiyonu duyurdu.
GPT-5.2’de Farklı Olan Ne?
Verimlilik için yapay zeka gelecek vadediyor ancak halen gidecek yolu var. OpenAI ekibi 5.2 ile bu yolda mesafe almış görünüyor. Profesyonel işler için daha kabiliyetli ve uzun süre sorunsuz çalışabilen agentlar için en gelişmiş öncü model olarak biraz önce tanıtıldı.
“Profesyonel bilgi işleri için şimdiye kadarki en yetenekli model serisi olan GPT‑5.2’yi tanıtıyoruz.” – OpenAI
Son araştırmalar ortalama bir GPT kullanıcısının günde bu aracı kullanarak 40-60 dakika haftada 10 saat kazandığını söylüyor. Yeni versiyonun temel amacı daha fazla ekonomik değer sağlamak. Bunun için bazı konularda model daha da iyileştirildi.
- Excel tabloları oluşturma.
- Sunumlar hazırlama.
- Kod yazma.
- Görüntü yakalama.
- Uzun bağlamları anlama.
- Araçları kullanabilmek.
- Karmaşık ve çok adımlı projeleri yönetme.
GDPval dahil birçok benchmarkta ölçümler 5.1’e göre bu modelin daha iyi olduğunu gösteriyor. Mesela matematiksel işlemlerde %30’u aşan performans artışı var. ChatGPT’de GPT‑5.2 Instant, Thinking ve Pro, ücretli planlarla başlayarak bugün kullanıma sunulmaya başlayacak. API’da ise tüm geliştiriciler tarafından kullanıma hazır.
İnsandan İyi Performans
Modelin en dikkat çeken kısmı düşünme modunda gerçek dünyada profesyonel kullanım için iyi işler çıkarabiliyor olmasıdır. OpenAI şimdiye kadarki en iyisi olduğunu söylüyor. Hatta GPT‑5.2 Thinking, yeni bir rekor puan elde etti ve insan uzman seviyesinde veya üzerinde performans gösteren ilk model oldu. Bu insandan iyi işler çıkaran yapay zeka hayali için önemli bir eşik.
“GPT‑5.2 Thinking, GDPval bilgi işleri görevlerinde yapılan karşılaştırmaların %70,9’unda sektörün en iyi profesyonellerini geride bıraktı veya onlarla eşit sonuçlar elde etti. Bu görevler arasında sunumlar, elektronik tablolar da yer alıyor.
GPT‑5.2 Thinking, GDPval görevleri için uzman profesyonellerin 11 katından fazla hızda ve %1’den az maliyetle çıktı üretti. Bu da, insan gözetimi ile birleştirildiğinde GPT‑5.2’nin profesyonel çalışmalara yardımcı olabileceğini göstermektedir.” – OpenAI

GDPval jüri üyelerinden biri testlerin ardından şöyle bir yorum yaptı;
“Çıktı kalitesinde heyecan verici ve dikkat çekici bir sıçrama var… [bu] profesyonel bir şirketin personeli tarafından yapılmış gibi görünüyor ve her iki çıktı için de şaşırtıcı derecede iyi tasarlanmış bir düzen ve tavsiyeler içeriyor, ancak birinde hala düzeltmemiz gereken bazı küçük hatalar var.”

Yukarıda iki model arasındaki çıktı farkını görüyorsunuz. Yapay zeka profesyonellerin elinde adeta bilgisayarın keşfi gibi bir verimlilik değişimine yol açıyor. Örneğin bilgisayardan önce bir muhasebeci oldukça iyi şekilde muhasebe kayıt defterleri tutabiliyordu ancak bilgisayar onun işini kolaylaştırdı ve daha iyi hale getirdi. Yapay zeka tam olarak buradaki değişim gibi görülürse işine hakim çalışanların işini daha iyi yapmak için bir araç olarak onu kullanması verimliliklerine büyük katkı sağlayacaktır. Yani işi yapay zekaya yaptırmak yerine işinizin bazı bölümlerinde yapay zekadan yararlanarak daha verimli çalışmanız mümkün. Bu da 1 haftada yapabileceğiniz işi 2-3 günde yapmanız demek.
Yapay zekadaki en büyük sorun halüsinasyon ve her yeni modelde baktığımız şey de bu oluyor. AI’ın kelime türetme hayali olayları gerçekmiş gibi anlatma gibi saçmalıkları hakim olmadığınız konularda sizi aptala çevirebilir. Profesyonel kullanıcılar onun bu aptallıklarından hep şikayet etti. Ancak yeni modelde halüsinasyon 5.1’deki %8,8’e göre %6,2’ye geriledi. Yani halen yüz cevaptan 6’sında yanlış şeyler olacak bu yüzden çıktıları iki kere kontrol etmeye devam etmelisiniz.
Son olarak çoklu ajan yetenekleri onu daha komplike işleri yapması için uygun hale getiriyor. Triple Whale CEO’su şunları söyledi;
“GPT-5.2 bizim için tam bir mimari dönüşümün kapılarını açtı. Kırılgan, çoklu ajan sistemini 20’den fazla araca sahip tek bir mega ajana dönüştürdük. En iyi yanı ise, sistemin sorunsuz çalışması. Mega ajan daha hızlı, daha akıllı ve bakımı 100 kat daha kolay. Gecikme süresi önemli ölçüde azaldı, araç çağırma çok daha güçlü hale geldi ve artık geniş sistem komutlarına ihtiyaç duymuyoruz çünkü 5.2, basit, tek satırlık bir komutla temiz bir şekilde çalışıyor. Sanki sihir gibi.”
Eğer OpenAI bu hızlı model gelişimiyle daha hızlı biçimde kazanç elde eden bir şirkete dönüşürse AI balonu tartışmaları azalırken risk piyasalarındaki büyüme de güçlenir. Yeni satış rakamları, gelirlere dair açıklamalar bu yüzden önemli olacak çünkü bu modeldeki detaylar 5.2’nin şirketler tarafından daha yoğun kullanılabileceğini söylüyor.




