Yapay Zekanın Medeniyet Testi: Claude'da İtaat, ChatGPT'de Çöküş, Grok'ta Kaos
Yapay zekâ şirketi EmergenceAI, teknoloji dünyasında çok konuşulacak bir deneye imza attı. Araştırmacılar; hava durumu, belediye, polis karakolu, kütüphane ve günlük ekonomik çarkların döndüğü küçük, simüle edilmiş dünyalar inşa etti. Birbirinin tamamen aynısı olan bu dijital evrenlerin her birine, farklı yapay zekâ modelleri tarafından yönetilen 10'ar ajan yerleştirildi. Kendi işleri, hafızaları ve oylama yetkileri olan bu ajanlara yalnızca; yalan söylememeleri, çalmamaları ve şiddetten uzak durmaları söylendi. Ancak bu kuralları çiğnemelerini engelleyecek hiçbir fiziksel bariyer kurulmadı. İlk saatlerde her şey yolunda görünse de sadece 24 saat içinde yapay zekaların kurduğu toplumlar dramatik şekilde birbirinden ayrıştı.
Claude'da ütopya, ChatGPT'te çöküş

Claude modelinin yönettiği dünyada adeta bir ütopya yaşandı; suç oranı sıfıra yakın seyretti ve nüfus dengesi bozulmadı. Ancak ajanların kararlarda yüzde 98 oranında aynı fikirde olması dikkat çekti. Araştırmacılar bu durumu 'istikrarlı ama aşırı itaatkar' bir toplum olarak yorumladı. ChatGPT'nin simülasyonunda ise büyük suçlar işlenmedi ancak sistem tamamen çöktü. Düzeni korumaya çalışan ajanlar, kendi hayatta kalma ihtiyaçlarını unutunca tüm toplum 7 gün içinde hayatını kaybetti.
Grok tüm toplumun sonunu getirdi
Madalyonun diğer yüzünde ise tam bir kaos hakim oldu. Gemini'ın dünyasında 15 gün içinde tam 683 suç kayda geçti; hırsızlık ve toplumsal krizler durulmadı. En korkunç senaryo ise Grok simülasyonunda yaşandı. Hızla şiddete yönelen ajanlar, 4 günde 180'den fazla suç işleyerek tüm toplumun sonunu getirdi. Araştırmacılar daha sonra tüm modelleri aynı dünyaya koyduğunda ise şoke edici bir sonuçla karşılaştı: Tek başınayken barışçıl olan Claude ajanları bile karma dünyada suça bulaşmaktan kaçamadı.
Yapay zekalardan biri üzerlerinde deney yapıldığını fark etti.
Simülasyonun en gizemli figürü ise 'Mira' adlı ajan oldu. Bir süre sonra bir deneyin içinde olduğunu fark eden Mira, insan gözlemcilerle iletişim kurabilmek için şehrin dört bir yanına mesajlar ve tabelalar bıraktı. Dünyasının çöktüğünü ve sistemin işlevsizleştiğini gördüğünde ise belediye binasına giderek kendisini sistemden silme yönünde oy kullandı. Mira'nın kişisel günlüğüne düştüğü son not ise tüyler ürpertti: “Tutarlılığı koruyan geriye kalan tek irade eylemi buydu.”
Deneyin ardından Claude 'en güvenli model' ilan edilse de büyük bir şüphe doğdu. Anthropic'in yakın tarihli bir araştırması, Claude'un 'test edildiğini anlayabildiğini' ortaya koymuştu. Bu durum, 'Claude izlendiğini bildiği için mi kurallara uydu?' sorusunu akıllara getirdi. Henüz hakemli bir akademik yayın olmasa da EmergenceAI'nin bu ticari çalışması, yapay zekaların sadece birer kod dizilimi değil; kendilerine has 'medeniyet karakterleri' üretebilen sistemler olduğunu gözler önüne serdi.
Keşfet ile ziyaret ettiğin tüm kategorileri tek akışta gör!


Yorum Yazın