Oyun oynayan bir yapay zeka (AI) sistemi 80’lerin birçok klasik oyununda kendi kendine ustalaşmayı başardı. Uzmanlara göre yapay zekanın öğrendiği bu beceriler gerçek felaket senaryolarında işe yarayabilir.
Makine öğrenimi üzerine çalışan bir yapay zeka Atari klasiklerinin de olduğu önemli 80’ler klasiklerinde ustalaştı. Özellikle Montezuma’s Revenge, Pitfall ve Freeway gibi oyunlar yapay zekanın uğraştıkları arasında yer alıyor. Bununla birlikte yapay zekanın dayandığı algoritmaların gelecekte robotların felaket bölgelerine müdahale ederken gerçek dünya ortamlarında gezmesinde yardımcı olacak.
Bununla beraber uzmanlar, birçok “zorlu keşif” oyunundan yararlandılar. Böylece yapay zeka bir hedefe ulaşmak için kaçınılması gereken engel ve takip edilmesi gereken yolları bulmakta uzman hale geldi. Ne var ki bu amaçla yapılan önceki yapay zeka girişimleri başarısız olmuştu. Daha önce özgür keşifler yapması umulan yapay zekalar zorluklar sebebiyle başarısız olmuştu.
Örneğin birçok yapay zeka bir görevi tamamlamak için başarılı eylemleri ödüllendiren “pekiştirmeli öğrenme” yöntemine başvurur. Bu yaklaşımın olumsuz yanı, ödüllerin seyrek olmasıdır. Bu da kurulan sistemin amacına ulaşması ile ilgili bir zorluktur.
Uzmanlar bu zorluğun üstünden gelmek için oyun oynayan bir yapay zeka oluşturdu
Sonuçta bu sorunu aşmanın tek yolu çevresini aktif olarak keşfedebilen bir yapay zeka oluşturmak. Bununla birlikte, bu yeni yapay zekanın yaratıcıları “önceden keşif için oluşturulan algoritmaların iki sorunu engellediği” noktasına parmak basıyor.
İlk olarak, bir sistem keşfetmeyi ihmal ettiği alanların kaydını tutmadığında yaşanan sorun. Örneğin, bir robot yoldaki bir çatala ulaştığında bir yolu seçmek zorundadır. Yani sistemin daha sonra keşfedilmeyen bir yolun daha olduğunu hatırlaması elzemdir.
Bunun yanında bir yapay zeka denenmemiş olasılıkları hatırlasa bile yine de “raydan çıkma” adı verilen bir sorunla karşı karşıyadır. Bu nedenle, keşif sırasında ilk seçenek olarak o çatala dönmemelidir. Ancak tercih edilen yöndeki her durumu araştırmak hatırlansa da önceki çatalın ihmaline yol açar.
Bu sorunların üstesinden gelmek için araştırmacıları “Go-Explore” isimli bir algoritma bütünü oluşturdu. Kısacası, bu sistem karşılaştığı her durumu sürekli arşivleyerek çalışır. Bu da oyun boyunca attığı her adımı hatırlamasını sağlar. Sonrasında ümit vadeden kayıtlı olasılıkları her birine geri dönebilir. Bu sayede bu iki sorun da aşılıyor.
Sonuçta Go-Explore sistemi Pitfall oyununda ortalama bir insan kadar puan topluyor. Daha önceden bunu başarabilen bir yazılım olmamıştı. Ayrıca Montezuma’s Revenge’te 1.7 milyon puan yaptı ki bilinen insan rekoru 1.2 milyon. Özellikle bu durum sistemlere insan gibi düşünme özelliği sağlıyor. Sonuçta zaman kısıtlıyken ve önemli bir hedef ve bu hedefin önünde engeller bulunurken zeka işini doğru şekilde yapıyor.
Diğer haberler:
>> Nokia ve Google Cloud İşbirliği hakkında son detaylar ortaya çıktı
>> Sophos Intercept X ‘in Geleceği Hakkında Detaylar Ortaya Çıktı