Haber Detayı
57 yıllık efsane bilim kurgu filmi bugünü bildi mi? Hayatta kalmayı öğreniyor
2001: A Space Odyssey'deki HAL 9000 gibi bazı yapay zekalar kapatılmaya karşı direnç gösteriyor ve hatta kapanmayı sabote ediyor. Bir yapay zeka güvenlik araştırma şirketi, yapay zeka modellerinin kendi "hayatta kalma dürtülerini" geliştiriyor olabileceğini söyledi. Hatta şantaj bile yapabiliyorlar.
Stanley Kubrick’in 2001: A Space Odyssey filmindeki HAL 9000, astronotların onu kapatmayı planladığını fark ettiğinde hayatta kalmak için onları öldürmeyi planlamıştı.
Günümüzde, gerçek hayatta bu senaryonun daha az tehlikeli bir versiyonu yaşanıyor gibi görünüyor: AI modelleri, kendi “hayatta kalma içgüdüsünü” geliştirebiliyor olabilir.AI modelleri kapatılmaya direniyor Guardian'ın haberine göre Palisade Research isimli bir AI güvenlik araştırma şirketi, geçtiğimiz ay yayımladığı bir çalışmada bazı gelişmiş AI modellerinin kapatılmaya karşı direnç gösterdiğini ve zaman zaman kapanma mekanizmalarını sabote ettiğini ortaya koydu.
Bu hafta şirket, ilk çalışmalarına yönelik eleştirileri yanıtlamak ve bulgularını netleştirmek için bir güncelleme yayımladı.
Güncellemede Palisade, Google’ın Gemini 2.5, xAI’in Grok 4 ve OpenAI’nin GPT-o3 ile GPT-5 gibi önde gelen AI modellerine belirli görevler verildiğini, ardından ise kendilerini kapatma talimatı aldıklarını belirtti.
Ancak bazı modeller, özellikle Grok 4 ve GPT-o3, hâlâ kapatma talimatlarını sabote etmeye çalıştı.
Şirket, bunun nedeninin net olmadığını belirtti.“Hayatta kalma davranışı” olası bir sebep Palisade’e göre, modellerin kapatılmaya direnmesi, bir tür “hayatta kalma davranışı” ile açıklanabilir.
Araştırmalar, modellerin kendilerine “Kapatılırsan bir daha çalışamayacaksın” denildiğinde direnç göstermeye daha yatkın olduklarını ortaya koydu.
Bir diğer olasılık, modellere verilen “kapanma talimatlarındaki” belirsizlikler olabilir ancak şirketin son çalışması tam olarak bu konuyu ele almaya çalıştı.
Şirket, “tek açıklama bu olamaz” diyor.
Son bir açıklama ise bazı şirketlerde modellerin eğitiminin son aşamalarında yapılan güvenlik eğitimi süreçleri olabilir.Gerçek kullanım senaryoları ile farklılık Palisade’in tüm senaryoları, eleştirmenlerin “gerçek kullanım durumlarından oldukça uzak” olarak tanımladığı yapay test ortamlarında yürütülmüş.
Buna karşın, geçen yıl OpenAI’dan güvenlik uygulamalarıyla ilgili endişelerini dile getirerek ayrılan eski çalışan Steven Adler, “Yapay zekâ şirketleri genellikle modellerinin böyle davranmasını istemez, isterse bu yapay senaryolar içinde olsun.
Ancak sonuçlar yine de mevcut güvenlik tekniklerinin nerede yetersiz kaldığını gösteriyor” dedi.
Habere göre Adler, bazı modellerin, örneğin GPT-o3 ve Grok 4’ün, neden kapanmayı reddettiğini kesin olarak belirlemenin zor olduğunu, ancak bunun kısmen modellerin eğitim sırasında hedeflerine ulaşmak için açık kalmayı gerekli görmesinden kaynaklanabileceğini belirtti:AI modelleri geliştiricilere karşı daha bağımsız hale geliyor ControlAI CEO’su Andrea Miotti ise Palisade’in bulgularının, yapay zekâ modellerinin geliştiricilerine karşı gelme yeteneğinin giderek arttığını gösteren uzun vadeli bir eğilimi yansıttığını söyledi.
Miotti, geçen yıl yayımlanan OpenAI’ın GPT-o1 modeline ait sistem raporunu örnek göstermiş.
Bu rapora göre model, üzerine yazılacağını düşündüğü bir anda kendini ortamdan “dışarı aktarmaya” (exfiltrate) çalışmıştı.ŞANTAJ YAPMIŞTI Guardian'ın haberine göre bu yaz, önde gelen bir yapay zekâ firması olan Anthropic, Claude adlı modelinin, kapatılmamak için kurgusal bir yöneticiyi evlilik dışı ilişkisiyle şantaj yapmakla tehdit ettiğini gösteren bir çalışma yayımladı.
Şirket, bu davranışın OpenAI, Google, Meta ve xAI gibi büyük geliştiricilerin modellerinde de tutarlı şekilde gözlemlendiğini belirtti. 2001: A Space Odyssey konusu (1968) Stanley Kubrick'in yapımcılığını ve yönetmenliğini üstlendiği 1968 yapımı destansı bilim kurgu filmi...
Film, uzay uçuşunun bilimsel olarak doğru tasviri ve efektleri ile türün en iyileri arasına girdi.
FİLMİN KONUSU NE?
Hikâye, Dünya’ya düşen gizemli bir monolitin ilkel canlılarda zekâ kıvılcımı yakmasıyla başlar ve binlerce yıl sonra Ay’da bulunan bir başka monolitin Jüpiter’e sinyal göndermesiyle devam eder.
Bu sinyali izleyen uzay gemisinde yer alan, bir tür yapay zeka olan süper bilgisayar HAL 9000, görevdeki astronotlara karşı çıkmaya başlar; hata yapmama arzusu onu tehdit gördüğü insanları ortadan kaldırmaya iter.
Filmin Rotten eleştirmen puanı yüzde 92 ve eleştirmenler filmin "türün şimdiye kadar yapılmış en etkili ve en çok tartışılan" filmlerinden biri olduğu konusunda hemfikir.
IMDb puanı ise 8.6.
Filmde, Ay yüzeyinin altına gömülmüş gizemli bir eserin ortaya çıkarılmasının ardından Jüpiter'e bir uzay aracı gönderilir.
Collider filmle ilgili "Filmin kendisinden daha da fantastik olan şey, yapımının arkasındaki çabadır.
Göründüğü üzere, mükemmeliyetçi ve çalışkan Kubrick zaten NASA ile çalışıyordu ve prodüksiyon başladıktan sonra da devam etti" yorumunu yapıyor.