Geçtiğimiz günlerde metinleri videoya dönüştürme ile ilgili bir sunum gerçekleştiren Google’ın ardından son bir kaç yıldır adından gerek gelişimiyle gerek skandallarıyla gerekse başındaki kişilerle söz ettiren dev şirket OpenAI, dün yani Perşembe günü benzer bir model olarak hizmet verecek olan Sora’yı tanıttı ve 24 saat dolmadan dünya genelinde inanılmaz bir yankı uyandırarak insanları şimdiden ikiye böldü.
Sora’nın Genel Görünümü
Chatgpt’nin gelişimi ve şirket içi çekişmeler sebebiyle büyük skandallara ev sahipliği yapan OpenAI ekibi yeni bir başarıya imza atmış görünüyor.
Chatgpt-4’ün ardından Sam Altman’ın geçtiğimiz günlerde Chatgpt-5 ile ilgili yapmış olduğu açıklamalar hala sıcaklığını korurken Sora isimli bir yazıyı videoya dönüştürme yapay zeka modeli tanıtıldı ve tanıtımın ardından tüm dünyayı söylem yerindeyse ayağa kaldırdı. Buna benzer bir açıklama geçtiğimiz günlerde Google tarafından gelmişti.
Google’ın tanıttığı Lumiere’i gibi Sora’nın da kullanılabilirliği yapılan açıklamalara göre sınırlandırılacakmış gibi görünüyor. Sora’yı bu mücadelede ön plana taşıyacakmış gibi görünen en büyük özelliği ise tanıtımı itibariyle belirtilen 1 dakikaya kadar video üretme özelliği olarak görülüyor.
OpenAI’ın gerçekleştirdiği bu hamlelerin, 2032 yılına kadar 1,3 trilyon dolara ulaşacağı tahmin edilen sektörde Google, Microsoft ve diğer rakiplerinin arasından sıyrılmak konusunda şirkete büyük katkılar sağlayabileceği düşünülmektedir.
Bu bağlamda ChatGPT ile yetinmeyen şirket, sahip olduğu ve geliştirilmesi mümkün görünen üretken yapay zekayı doğru şekilde yöneterek tüketicilerin ilgisini şirket üzerinde toplamaya çalışıyormuş gibi görünüyor.
Hem ChatGPT hem de Dall-E ile büyük yankı uyandıran OpenAI şirketi Sora’nın hangi koşullarda test edileceğini de açıkladı. Sora’yı farklı yönleriyle test etmek isteyen şirket, yanlış bilgilendirme, nefret içerikleri ve önyargı konusunda uzman olan kişilere yöneleceğini açıklarken, Sora’yı kullanıma sunmadan önce olumsuzluklarını ortaya çıkarmaya çalışacak.
Şirket, bu kişilerin yanı sıra hali hazırda profesyonel hayatlarını sürdüren sanatçılar, tasarımcılar ve film yapımcılarından da geri dönüşler alacağını belirtirken ve Sora’nın gelişimi hakkında yeni adımlar atacakmış gibi görünüyor.
Yapılacak olan bu farklı yönlü testlerin, son dönemde sıkça ortaya çıkan görüntü ve video oluşturmak için yapay zeka kullanımına bağlı deepfake’ler ile ilgili adımlar atılmasına katkı sağlayacağı da düşünülüyor.
Sora’nın Güçlü Tarafları
Şirket tarafından yapılan açıklamaya yansıyan en büyük özelliklerden bir tanesi Sora’nın hali hazırda 135 kelimeyi bulan özetleri yorumlayabilmesi ve videolaştırabilmesi oldu.
OpenAI tarafından Perşembe günü yapılan paylaşımlarda bir çok örneğe yer verilirken şirketin başında bulunan isim Sam Altman olayı başka bir boyuta taşıdı ve bir X gönderisi altına kullanıcılardan metinlerini oluşturmalarını istedi ve onları video haline getirdi. Bu durum, ekibin uygulamaya ne kadar güvendiğini bir kez daha ortaya koydu.
OpenAI’ın Sora’sında Dall-E ve ChatGPT’nin büyük etkisinin görüldüğü de konuşulanlar arasında. Metinleri güçlü bir biçimde görsele dönüştüren Dall-E 3 Eylül ayında ortaya çıkmıştı.
Sora konusunda dikkat çeken bir diğer konu ise, OpenAI tarafından bir açıklamada “görsel eğitim verileri için son derece açıklayıcı başlıklar” ürettiğini belirtilen Dall-E 3’ün özetleme tekniğini kullanıyor olması.
OpenAI tarafından yapılan bir diğer açıklama ise şu şekilde oldu:
Sora, birden fazla karakter, belirli hareket türleri ve özne ile arka planın doğru ayrıntılarına sahip karmaşık sahneler oluşturabiliyor. Model yalnızca kullanıcının komut isteminde ne istediğini değil, aynı zamanda bu şeylerin fiziksel dünyada nasıl var olduğunu da anlıyor.
Bu süreçte OpenAI ve Altman tarafından paylaşılan videoların ne kadar gerçekçi olduğu da kullanıcılar özelinde şaşkınlık yaratmış görünüyordu. Sora’nın aynı zamanda hareketsiz görüntülerden video oluşturabileceği de açıklanırken hali hazırda var olan mevcut videoları genişletebileceği ve eksik kareleri doldurabileceği belirtildi.
Açıklamanın devamı şu şekilde oldu:
Sora, gerçek dünyayı anlayabilen ve simüle edebilen modeller için bir temel oluşturuyor; bu yeteneğin AGI’ye ulaşmak için önemli bir kilometre taşı olacağına inanıyoruz.
Sora’nın Potansiyel Zayıf Yönleri
OpenAI projenin şimdilik zayıf görünen yanlarını da açıklamaktan geri durmadı. Şirket, Sora’nın şu anda sahip olduğu versiyonuyla karmaşık bir sahnenin gelişimini tasvir etmekte ve neden-sonuç ilişkisi kurmakta zorlandığı yönünde geri bildirimler aldıklarını belirtti.
Yapılan açıklamada verilen örnek ise şu şekilde oldu:
Örneğin, bir kişi bir kurabiyeden bir ısırık alabilir, ancak daha sonra kurabiyede ısırık izi olmayabilir. Hala hangisinin solda olduğunu anlamak konusunda sıkıntı yaşıyor olabilir. Sora sağ ve solu da karıştırıyor!
OpenAI tarafından belirtilen bir diğer konu ise Sora’nın paylaşıma sunulacağı tarih ile ilgili oldu. Şirket, uygulamanın ne zaman kullanıma sunulacağını paylaşmadı ve bunu “birkaç önemli güvenlik adımı” atma gerekliliğiyle ilişkilendirdi. Yapılan açıklama ise şu şekilde oldu:
Kapsamlı araştırma ve testlere rağmen, insanların teknolojimizi kullanacakları tüm faydalı yolları ya da insanların onu kötüye kullanacakları tüm yolları tahmin edemiyoruz. Bu nedenle, gerçek dünya kullanımından öğrenmenin, zaman içinde giderek daha güvenli yapay zeka sistemleri oluşturmanın ve piyasaya sürmenin kritik bir bileşeni olduğuna inanıyoruz.