Yapay zeka video araçlarının yeni rakibi: Kling

Yapay zeka video araçlarının yeni rakibi: Kling

Çinli şirket Kuaishou Technology’nin yeni video yapay zeka modeli Kling, Open AI’ın geliştirdiği Sora’nın en büyük rakibi olarak görülüyor. İşte Kling ve etkileyici özellikleri… 

Çözünürlüğü ve süresi yüksek videolar

Geçtiğimiz şubat ayında tanıtılan ve mart ayında blogumuzda detaylarına yer verdiğimiz yapay zeka video aracı Sora’nın (Open AI) rakibi tanıtıldı. Haziran ayı başında Çinli şirket Kuaishou’nun uygulaması Kling, girilen metinleri videoya çok gerçekçi, kaliteli, zahmetsiz ve verimli bir şekilde dönüştürüyor. Karmaşık eylemleri de çok başarılı şekilde modelleyen üç boyutlu uzay-zamansal dikkat modüllerini kullanan Kling, bu sayede yüksek kaliteli, verilen komuttan sapmayan ve bol hareket içeren videolar oluşturabiliyor. Sora’nın henüz herkesin kullanımına açılmadığını, Kling’in ise (Türkiye hariç) Çince kelimeler kullanma koşuluyla erişime açık olduğunu belirtelim.

1080p çözünürlükte, 30 fps ve iki dakika uzunluğunda, sinema kalitesinde videolar oluşturabilen Kling, gerçek dünyanın fiziksel özelliklerini iyi algılayarak üretim yapıyor. Kling, sınırsız hayal gücünü ve gerçekte var olmayacak sahneleri somut olarak ortaya koyma konusunda da oldukça yetenekli. Üstelik geniş ve gösterişli panoramik sahnelerde de ince ayrıntılar içeren yakın çekimlerde de çok iyi. Kling’in bu başarısı, derin öğrenme modeli 3B VAE (Variational Auto Encoder), değişken çözünürlük eğitimi aracı ve gelişmiş 3B yüz ve vücut yeniden yapılandırma teknolojisinden geliyor. 

Görseli de videoya dönüştürebiliyor

Geniş bir hareket yelpazesine sahip olan Kling, sadece metinlerle değil, statik görüntülerle de video üretebiliyor. Giriş yapılan görsellerden, canlı ve beş saniyelik videolar hazırlayan Kling, video oluştururken metin girişlerini de entegre ediyor.

Ayrıca Kling uzmanlarının geliştirdiği üç boyutlu yüz ve vücut yeniden yapılandırma teknolojisi, arka plan sabitleme ve yönlendirme modülleriyle birleşerek kapsamlı bir ifade ve vücut animasyonu yaratabilmeyi sağlıyor. Sisteme yüklenecek statik tam bir vücut görseli, şarkı söylenen ve dans edilen bir videoya dönüşebiliyor.  

Kling’de oluşturulan videoları uzatmak da mümkün

Kling’de oluşturan dinamik ve uygun hareketler içeren videolar, ek olarak 4,5 saniye kadar uzatılabiliyor. Örneğin bir kadının kameraya baktığı bir video, “Kadın şapkasının kenarına dokunmak için elini kaldırır.” ve “Kadın daha sonra elini indirir ve uzaklara bakar.” şeklinde metin komutları girilerek daha uzun ve daha hareketli bir video elde edilebiliyor. Kling, ardışık video uzantılarını desteklediği için üç dakikaya kadar video oluşturabiliyor. 

Kuaishou Technology hakkında

Kuaishou 2011 yılında kurulan, içerik paylaşım platformları geliştiren ve içerik üretimini, dağıtımını ve tüketimini hızlı ve kolay hale getiren Çinli bir teknoloji şirketi. Dünya genelinde ortalama Günlük Aktif Kullanıcı (DAU) bazında en büyük ikinci kısa video platformu ve Brüt Mal Hacmi (GMV) bazında en büyük ikinci canlı yayın e-ticaret platformu olan Kuaishou’nun 600 milyondan fazla aktif kullanıcısı bulunuyor. Şu an 20 binden fazla çalışanı olan şirketin merkezi Pekin’de yer alıyor. 

Videolar ve kaynak:

https://kling.kuaishou.com/

https://www.technologyreview.com