Yapay zeka teknolojisi, hayatımızın vazgeçilmez bir parçası haline gelirken, beraberinde bazı riskleri de getiriyor. Özellikle üretken yapay zeka modellerinin sunduğu imkanlar, siber suçlular için de yeni fırsatlar yaratıyor. Son yapılan araştırmalar, Google’ın gelişmiş yapay zeka modeli Gemini ‘nin, “Eğlence-Ayarı” adı verilen bir yöntemle hacklenebileceğini ortaya koyuyor. Bu keşif, yapay zeka güvenliği konusunda yeni endişeleri beraberinde getiriyor.
Siber suçluların Gemini ve yapay zeka modellerini manipüle etmek için kullandığı en yaygın yöntemlerden biri “istem enjeksiyonu”. Bu yöntemde, kötü niyetli kişiler, yapay zeka modeline verilen komutlara gizli metinler ekleyerek modelin istenmeyen eylemler gerçekleştirmesini sağlıyor. Özellikle bazı dil modellerinin, kullanıcı ve geliştirici komutlarını ayırt edememesi, bu tür saldırıları kolaylaştırıyor.
Gemini’nin Savunmasızlığı: “Eğlence-Ayarı” Tekniği
UC San Diego ve Wisconsin Üniversitesi’ndeki araştırmacılar, Gemini modellerini hedef alan yeni bir hackleme yöntemi keşfetti. “Eğlence-Ayarı” olarak adlandırılan bu teknik, komutların başına ve sonuna rastgele karakterler ekleyerek modelin manipüle edilme olasılığını artırıyor. Örneğin, bir komutun “wandel!!!!” veya “formatlanmış! ASAP!” gibi ifadelerle çevrelenmesi, saldırının başarı şansını önemli ölçüde yükseltiyor.
Araştırmalar, bu yöntemin Gemini 1.5’i %65, Gemini 1.0 Pro’yu ise %80 oranında başarıyla kandırabildiğini gösteriyor. Daha da endişe verici olanı, Gemini’nin kendi değerlendirme aracının da bu tür saldırılara karşı savunmasız olması. Modelin verdiği yanıtların doğruluğunu ölçen bu araç, siber suçlular tarafından manipülasyon için kullanılabiliyor.
Google’ın Önündeki Kritik Soru: Yapay Zeka Güvenliği Nasıl Sağlanacak?
Bu bulgular, Google’ın yapay zeka güvenliği konusunda acil önlemler alması gerektiğini gösteriyor. Gemini 2.0 veya Gemini 2.5 Pro gibi daha gelişmiş modellerin bu tür saldırılara karşı ne kadar dayanıklı olduğu henüz bilinmiyor. Ancak, yapay zeka teknolojisinin hızla geliştiği bu dönemde, güvenlik açıklarının da aynı hızla kapatılması büyük önem taşıyor.