Yapay zekanın elle tutulur bir şey olduğunu 2022 Kasım ayında gördük ve aradan geçen 1,5 yılda çok fazla şey oldu. Yapay zeka alanındaki büyüme internetin geleceğini doğal olarak web3 hikayesini direkt olarak etkilediğinden her büyük gelişme bizim için önemli olmalı. Ve bugün Mira Murati “gerçekten büyük bir adım attık” diyor.
GPT-4o Nedir?
Ses, görüntü ve metin girişleriyle yapay zeka ürünlerinden heyecan verici çıktılar almak mümkün. Seslendirmeler, görüntü işleme ve yeni, hayal gücüne bağlı görüntüler üretme, metin girişiyle ses ve görüntü hatta video çıktıları almak mümkün. Peki ya bu eş zamanlı olsaydı? GPT-4o yeni bir ürün ve tam olarak bunu yapıyor. Ses, görüntü ve metin arasında gerçek zamanlı olarak mantık yürütebilen bu model birçok şeyi değiştirebilir.
Peki ismi nereden geliyor? GPT standart ve o kısmı da “omni”yi temsil ediyor. Bazı özellikleri şöyle;
- Metin, ses ve görüntü kombinasyonlarında girdi kabul ediyor.
- Aynı şekilde bunların kombinasyonlarında çıktı verebiliyor.
- Ses girdilerine 232 milisaniye gibi kısa sürece cevap verebiliyor.
- İngilizce ve kodlu metinlerde GPT-4 Turbo performansıyla eşdeğer.
- İngilizce dışındaki dillerde önemli iyileştirmeler yapıldı.
- API daha hızlı ve yüzde 50 daha ucuz.
- GPT-4o, mevcut modellere kıyasla özellikle görüntü ve ses yorumlama konusunda OpenAI’ın şimdiye kadarki en iyi modeli olma özelliğine de sahip.
GPT-4o’nun metin ve görüntü özellikleri 13 Mayıs itibariyle kullanıma sunuldu. Tüm kullanıcılar deneme imkanına sahipken Plus üyeleri 5 kat daha fazla mesaj gönderim limitine sahip. Önümüzdeki birkaç hafta içinde ChatGPT Plus’ta GPT-4o ile Ses Modu’nun yeni sürümü de başlatılacak.
Gerçekten Büyük Bir Adım
Robotlar ve mantık yürütebilen eşyalar filmlerde alışık olduğumuz şeylerdi. Ancak bugün teknik olarak hepsi hatta daha fazlası mümkün hale geliyor. Teknolojinin geldiği yeri anlamak bu yüzden son derece önemli. OpenAI CEO’su Sam Altman duyurunun ardından yayınladığı blog yazısında şunları söyledi;
“Filmlerdeki yapay zeka gibi hissettiriyor; ve gerçek olması benim için hala biraz şaşırtıcı. İnsan düzeyinde tepki sürelerine ve ifade gücüne ulaşmak büyük bir değişiklik olacak.”