Google DeepMind, metin komutlarından veya durağan görsellerden interaktif ve gezilebilir oyun dünyaları oluşturan yapay zeka aracı Project Genie’yi sınırlı bir kullanıcı kitlesinin deneyimine açtı. ABD’deki Google AI Ultra aboneleri için deneysel bir araştırma prototipi olarak sunulan bu yeni araç, yapay zekanın sadece içerik üretmekle kalmayıp, fizik kurallarına sahip tutarlı evrenler kurgulama yeteneğini de sergiliyor.
Sistemin teknolojik altyapısı, Google’ın en gelişmiş üç modelinin birleşiminden oluşuyor: Google’ın gelişmiş dünya modeli Genie 3, görsel oluşturma modeli Nano Banana Pro ve çok modlu yapay zeka Gemini. Bu kombinasyon, kullanıcıların hayalindeki sahneleri anlık olarak oynanabilir dijital alanlara dönüştürmesine olanak tanıyor.
![]() |
| Google DeepMind Metin Komutlarını Gerçek Zamanlı Oyun Dünyalarına Dönüştürüyor |
Dünya Modelleri ve Yapay Genel Zeka Hedefi
Dünya modelleri, bir ortamın içsel mantığını kavrayabilen, gelecekteki olası sonuçları tahmin edebilen ve bu doğrultuda eylemler planlayabilen sistemlerdir. DeepMind araştırmacıları, bu modelleri Yapay Genel Zekaya (AGI) giden yolda en kritik basamaklardan biri olarak nitelendiriyor. Project Genie’nin odak noktaları şu şekildedir:
- Eğlence ve Oyun: Kullanıcıların teknik bilgiye ihtiyaç duymadan kendi oyun evrenlerini yaratmaları.
- Robotik Eğitim: Fiziksel robotların (embodied agents) simülasyon ortamlarında eğitilmesi için sonsuz çeşitlilikte veri seti oluşturulması.
- İnteraktif Deneyim: Statik görsellerin, içine girilip keşfedilebilen dinamik alanlara dönüştürülmesi.
Project Genie Nasıl Kullanılıyor?
Kullanıcılar, oluşturmak istedikleri ortamı ve ana karakteri metin yoluyla tanımlayarak bir "dünya taslağı" hazırlıyor. Nano Banana Pro bu tanıma uygun bir görsel oluştururken, Genie 3 bu görseli temel alarak karakterin etkileşime girebileceği, birinci veya üçüncü şahıs bakış açısıyla gezilebilen bir dünya inşa ediyor. Sistemin öne çıkan yetenekleri ve sınırlamaları şunlardır:
- Fotoğraftan Dünya Üretimi: Gerçek hayatta çekilmiş fotoğraflar sisteme yüklenerek, bu fotoğraflardaki nesnelerin hareket edebildiği dijital dünyalar oluşturulabiliyor.
- Sanatsal Esneklik: Model; sulu boya, anime, kil modelleme (claymation) veya klasik çizgi film tarzlarındaki komutları yüksek başarıyla uyguluyor.
- İşlem Gücü Sınırı: Yüksek hesaplama maliyetleri nedeniyle, şu an için her kullanıcıya 60 saniyelik dünya üretimi ve navigasyon süresi tanınıyor.
- Güvenlik Filtreleri: Telif hakları ve etik kurallar gereği, Disney gibi markalı içeriklerin veya uygunsuz görsellerin üretilmesine izin verilmiyor.
Geliştirilmeye Açık Alanlar
DeepMind araştırmacıları, Project Genie'nin henüz deneysel bir aşamada olduğunun altını çiziyor. Mevcut prototipte karakterlerin katı nesnelerin içinden geçmesi (collision detection sorunları) ve gerçekçi/fotorealistik sahnelerde yaşanan tutarsızlıklar, ekibin üzerinde çalıştığı temel problemler arasında yer alıyor. Ayrıca, klavye kontrollerindeki gecikmelerin ve etkileşim kapasitesinin gelecek sürümlerde iyileştirilmesi hedefleniyor.
Androdom'un Notu
Project Genie, oyun geliştirme dünyasında "kod yazma" döneminden "hayal etme" dönemine geçişin en somut işaretlerinden biri. Her ne kadar şu an 60 saniyelik bir deneyim sunsa da, bu teknoloji gelecekte kişiselleştirilmiş ve sonsuz varyasyonlu oyun evrenlerinin kapısını aralayarak içerik üretimini tamamen dönüştürecektir.

Yorumlar
Yorum Gönder