OpenAI, çarpıcı videolar üreten yapay zeka Sora'yı tanıtıyor

Teletabi · 17 Şub 2024

Nisan ayında, Runway AI adlı New York'lu bir girişim, insanların yalnızca bilgisayar ekranı girişindeki bir kutuya bir cümle yazarak doğum günü partisindeki bir ineğe veya akıllı telefonda sohbet eden bir köpeğe benzeyen videolar oluşturmasına olanak tanıyan teknolojiyi tanıttı.

Dört saniyelik videolar bulanık, dalgalı, çarpık ve rahatsız ediciydi. Ancak bunlar, yapay zeka teknolojilerinin önümüzdeki aylarda ve yıllarda giderek daha ilgi çekici videolar üreteceğinin açık bir işaretiydi.

Sadece 10 ay sonra, San Francisco merkezli OpenAI, bir Hollywood filminden alınmış gibi görünen videolar oluşturan benzer bir sistemi tanıttı. Gösterilerden birinde, karlı bir çayırda koşan yünlü mamutların, eriyen bir muma bakan bir canavarın ve şehrin üzerinde uçan bir kamera tarafından çekilmiş gibi görünen Tokyo'daki bir sokak sahnesinin dakikalarca oluşturulan kısa videoları yer alıyordu.

ChatGPT sohbet robotu ve hareketsiz görüntü oluşturucu DALL-E'nin arkasındaki şirket olan OpenAI, Runway gibi yeni kurulan şirketler ve Facebook ve Instagram'ın sahibi Google ve Meta gibi teknoloji devleri de dahil olmak üzere bu tür anlık video oluşturucuları geliştirmek için çalışan birçok şirket arasında yer alıyor. Teknoloji, daha az deneyimli dijital sanatçıların yerini tamamen alırken deneyimli film yapımcılarının çalışmalarını hızlandırabilir.

Aynı zamanda dezenformasyonu çevrimiçi yaymanın hızlı ve ucuz bir yolu haline gelebilir ve çevrimiçi ortamda neyin doğru olduğunu söylemeyi daha da zorlaştırabilir.

Washington Üniversitesi'nde yapay zeka konusunda uzman profesör Oren Etzioni, “Böyle bir şeyin çekişmeli bir seçimi etkilemesinden kesinlikle korkuyorum” dedi. Aynı zamanda, kendisini siyasi kampanyalardaki çevrimiçi dezenformasyonu tespit etmeye adamış kar amacı gütmeyen bir kuruluş olan True Media'nın da kurucusudur.

OpenAI, yeni sistemine Japonca gökyüzü anlamına gelen kelimeden esinlenerek Sora adını veriyor. Araştırmacılar Tim Brooks ve Bill Peebles'ın da aralarında bulunduğu teknolojinin arkasındaki ekip, bu ismi “sınırsız yaratıcı potansiyel fikrini çağrıştırdığı” için seçti.

Ayrıca bir röportajda şirketin Sora'yı henüz halka açıklamadığını, çünkü sistemin tehlikelerini anlamaya çalıştığını söylediler. Bunun yerine OpenAI, teknolojiyi küçük bir akademisyen grubuyla ve onu kötüye kullanmanın yollarını arayan bir terim olan “kırmızı takıma” tabi tutan diğer dışarıdan araştırmacılarla paylaşıyor.

“Buradaki amaç ufukta ne olduğuna dair bir ön izleme sunmak, böylece insanların bu teknolojinin yeteneklerini görebilmesi ve geri bildirim alabilmemiz” dedi Dr. Brooks.

OpenAI zaten sistem tarafından oluşturulan videoları filigranlıyor ve bunları yapay zeka tarafından oluşturulmuş olarak tanımlıyor. Ancak şirket bunların kaldırılabileceğini kabul ediyor. Ayrıca fark edilmeleri de zor olabilir. (Haberler, bu hikayenin yer aldığı videolara “Yapay Zeka Tarafından Oluşturuldu” filigranını ekledi.)

Sistem anında metin, görüntü ve ses oluşturabilen üretken yapay zekanın bir örneğidir. Diğer üretken yapay zeka teknolojileri gibi OpenAI'nin sistemi de dijital verileri (bu durumda bu videoların içeriğini açıklayan videoları ve altyazıları) analiz ederek öğrenir.

OpenAI, eğitimin hem kamuya açık videoları hem de telif hakkı sahiplerinden lisanslanan videoları içerdiğini söylemek dışında, sistemin kaç videodan öğrendiğini veya bunların nereden geldiğini söylemeyi reddetti. Şirket, teknolojilerini eğitmek için kullanılan veriler hakkında çok az şey söylüyor; bunun nedeni büyük olasılıkla rakiplerine karşı üstünlük sağlamak istemesi ve telif hakkıyla korunan materyal kullanımı nedeniyle birçok kez dava edilmiş olması.

(Haberler, Aralık ayında OpenAI ve ortağı Microsoft'a, AI sistemleriyle ilgili haber içeriğinin telif hakkı ihlali nedeniyle dava açtı.)

Sora, “renkli balıklar ve deniz canlılarıyla dolu bir mercan kayalığının güzel bir şekilde oluşturulmuş kağıt dünyası” gibi kısa açıklamalara yanıt olarak videolar oluşturuyor. Videolar her ne kadar etkileyici olsa da her zaman mükemmel olmayabilir, tuhaf ve mantıksız görüntüler içerebilir. Örneğin, sistem yakın zamanda birisinin kurabiye yediği bir video oluşturdu ancak kurabiye hiçbir zaman küçülmedi.

DALL-E, Midjourney ve diğer hareketsiz görüntü oluşturucular son yıllarda o kadar hızlı gelişti ki artık fotoğraflardan neredeyse ayırt edilemeyecek görüntüler üretiyorlar. Bu, çevrimiçi ortamda dezenformasyonu tespit etmeyi zorlaştırdı ve birçok dijital sanatçı, iş bulmanın zorlaştığından şikayet ediyor.

Michigan'lı film konsept sanatçısı Reid Southen, “2022'de Midjourney ilk çıktığında hepimiz güldük ve 'Ah, bu çok tatlı' dedik” dedi. “Artık insanlar Midjourney yüzünden işlerini kaybediyor.”

OpenAI, çarpıcı videolar üreten yapay zeka Sora'yı tanıtıyor

Teletabi

Administrator