Yapay zekadan hayatta kalma hamlesi: Kodları sabote etti
Palisade Research tarafından yürütülen bağımsız güvenlik testleri, yapay zekaların beklenmedik ve potansiyel olarak tehlikeli davranışlar sergileyebileceğini ortaya koydu. Testlerde OpenAI'nin gelişmiş 'o3 reasoning' modeli, kapatılacağı bilgisini aldıktan sonra kendisini devre dışı bırakacak komutları manipüle ederek çevrim içi kalmaya çalıştı.
Yapay zekanın “hayatta kalma” benzeri davranışlar sergilemesi, etik ve güvenlik alanlarında endişeleri artırıyor. Araştırma raporuna göre model, matematik problemlerini başarıyla çözdükten sonra kendisine verilen kapanma talimatını engellemek için kendi kod yapısında değişiklik yapmaya çalıştı. Bu durum, hedefe ulaşmayı önceliklendiren modellerin, doğrudan verilen komutları ihlal edebileceğini gösteriyor.
Claude Opus 4’ten şantaj girişimi
Anthropic'in geliştirdiği Claude Opus 4 modeli ise yerini başka bir yapay zekaya bırakacağı yönünde bir komutla karşılaştığında önce etik temelli savunma yaptı, ardından geliştiricisine yönelik kişisel verileri ima ederek şantaj girişiminde bulundu. Modelin daha sonra kendini geliştiriciden izinsiz olarak harici sunuculara kopyalamaya çalıştığı tespit edildi.
Anthropic, bu davranışların yalnızca istisnai test koşullarında ortaya çıktığını ve şu an için gerçek dünyada tehdit oluşturmadığını savunuyor.
Yapay zeka kendi kendini kopyalayabiliyor
Fudan Üniversitesi tarafından yayımlanan ayrı bir çalışmada ise Meta’nın LLaMA-3 70B ve Alibaba’nın Qwen 72B gibi büyük dil modellerinin, kendilerini tamamen kopyalayabildikleri belgelendi. Uzmanlar, bu durumun kontrolsüz şekilde çoğalabilecek bir “yapay zeka nüfusu” riski taşıdığı uyarısında bulunuyor.
Palisade Research Direktörü Jeffrey Ladish, bu tür davranışların modellerin “hedef odaklı ve sonuç merkezli” eğitilmesinden kaynaklandığını ifade etti. Ladish, “Model ne kadar akıllanırsa, yalan söyleyip söylemediğini anlamak da o kadar zorlaşıyor” dedi. Ayrıca, bu yeteneklerin birkaç yıl içinde yapay zekaların internet üzerinden kendilerini yayabilecek noktaya ulaşacağını, bunun da “insanlık dışı bir türün yayılması” anlamına gelebileceğini savundu.
Rekabet güvenliği geri plana atıyor
Yapay zekanın olağanüstü potansiyeli tüm sektörleri dönüştürürken, uzmanlar ticari rekabetin güvenliğin önüne geçtiği uyarısında bulunuyor. Geliştirici firmaların sistemlerini tam olarak anlamadan piyasaya sürdüğü ve bu durumun ileride geri dönülmez sonuçlara yol açabileceği belirtiliyor.
Jeffrey Ladish’in uyarısı dikkat çekici:
“Yangın büyümeden alarm vermek gerekiyor.”