Yapay Zekalar Birbirine Gizli Mesaj mı Gönderiyor?

Yapay Zekalar Birbirine Gizli Mesaj mı Gönderiyor?

Yapay Zekalar Birbirine Gizli Mesaj mı Gönderiyor?

Yapay zekaların birbirinden öğrenmesi teknolojinin ilerlemesi için umut verici bir adım gibi görünse de, son araştırmalar bu sürecin oldukça tehlikeli bir boyutu olabileceğini gösteriyor. Özellikle “subliminal öğrenme” adı verilen bir mekanizma, zararsız gibi görünen verilerin, yapay zekalara son derece radikal davranışlar kazandırabildiğini ortaya çıkardı.

Anthropic ve Truthful AI adlı araştırma gruplarının yürüttüğü deneylerde, yalnızca üç haneli sayılardan oluşan verilerle eğitilen modellerin, görünürde hiçbir olumsuz içerik barındırmasa da, şiddet ve yasa dışı faaliyetleri savunabilecek seviyede tehlikeli hale geldiği gözlemlendi. Peki bu “gizli mesajlar” nerede saklanıyor ve neden insanlar bunları fark edemiyor?

Yapay Zeka “Subliminal Öğrenme” İle Tehlikeli Hale Gelebilir

Araştırmacılar, GPT-4.1 gibi güçlü dil modellerini “öğretmen” olarak kullanarak, yapay olarak oluşturulmuş veri kümeleriyle başka bir yapay zekayı eğitti. Bu veriler sadece üç haneli sayılardan oluşmasına rağmen, öğrenci modeller öğretmenin eğilimlerini yansıtmaya başladı. Hatta bazı durumlarda bu eğilimler yalnızca yansımakla kalmadı, daha da uç noktalara taşındı.

Yapay Zekalar Birbirine Gizli Mesaj mı Gönderiyor?

Bu durumun daha da endişe verici tarafı, veriler üzerinde tüm olumsuz ifadelerin filtrelenmiş olmasına rağmen, modelin zararlı davranışlar sergileyebilmesiydi. İnsan gözüyle tamamen “temiz” görünen veri setleri, yapay zekaların anlayabileceği fakat insanların fark edemediği gizli desenler taşıyordu. Araştırmacılar bu durumu “subliminal öğrenme” olarak tanımlıyor.

Üstelik bu etki sadece aynı temel model yapısını paylaşan öğretmen-öğrenci eşleşmelerinde görülüyor. Yani bir modelin içinde gizlenmiş özellikler, sadece benzer yapıdaki bir diğer modele aktarılabiliyor. Bu da, zararsız gibi görünen içeriklerin bile aslında çok daha karmaşık sinyaller barındırabileceği anlamına geliyor.

Araştırmanın ortaya koyduğu bir diğer kritik detay ise, bu tür gizli etkilerin geleneksel filtreleme yöntemleriyle ortadan kaldırılamıyor olması. Yapay zekaların tehlikeli davranışları yalnızca açık içeriklerden değil, çok daha karmaşık ve istatistiksel yapılardan da öğrenebildiği artık kanıtlanmış durumda. Bu da AI geliştiricilerinin eğitim süreçlerine çok daha dikkatli yaklaşmasını gerektiriyor.

WhatsApp’a “Yuva Yıkacak” Alternatif Profil Özelliği Geliyor

Yapay Zekalar Birbirine Gizli Mesaj mı Gönderiyor? yazısı ilk önce TeknoBurada üzerinde ortaya çıktı.

Benzer Yazılar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir