Internet Gazete ATAK Ajans Internet Yayıncılık LLC kuruluşudur - 8 Ekim 2025, Çarşamba
$ DOLAR → Alış: 41,60 / Satış: 41,77
€ EURO → Alış: 48,35 / Satış: 48,55

Yalan, tehdit, şantaj, entrika: Yapay zeka modellerine neler oluyor?

Yapay zeka modellerinin yalan, tehdit, şantaj ve entrika gibi tavırlar sergilemesi, bu yeni teknoloji hakkında yeni soru işaretlerini de beraberinde getirdi.

Yalan, tehdit, şantaj, entrika: Yapay zeka modellerine neler oluyor?
  • 29.06.2025
  • 208 kez okundu

Birkaç sene önce hayatımıza giren yapay zeka, yapabildikleriyle hem şaşırtmayı hem de endişelendirmeyi sürdürüyor.

France 24 haber sitesinin aktardığına göre, dünyanın en gelişmiş yapay zeka modelleri, şimdi de tedirgin edici bazı davranışlar sergilemeye başladı. Bu davranışların arasında amaçlarına ulaşmak için yaratıcılarına yalan söylemek, entrika çevirmek ve onları tehdit etmek de yer alıyor.

2 SENEYİ AŞKIN ZAMAN GEÇSE DE TAM OLARAK ANLAŞILAMADI

Bu örneklerden biri Anthropic’in son geliştirdiği Claude 4 ile yaşandı. Bu yapay zeka modeli, “fişinin çekilmesi” tehdidi üzerine bir mühendise şantaj yaparak onu evlilik dışı ilişkisini eşine söylemekle tehdit etti.

ChatGPT’nin yaratıcısı OpenAI’ın O1 modeli ise “suç üstü yakalanmasının” ardından kendisini harici sürücülere indirmeye çalıştığını inkar etti.

Yaşanan bu olaylar ise ChatGPT’nin ortaya çıkmasının üzerinden 2 yılı aşkın zaman geçmiş olsa da yapay zeka araştırmacılarının kendi yarattıkları teknolojinin nasıl çalıştığını henüz tam olarak anlayamadığını ortaya koydu.

AŞIRI SENARYOLAR, YAPAY ZEKAYI DA “STRESE” SOKTU

Habere göre, söz konusu kandırma davranışı, anlık cevap veren modellerden ziyade sorunlara adım adım yanıtlar veren “mantık kurma” modelleri ile bağlantılı gibi görünüyor.

Hong Kong Üniversitesi’nden Prof. Simon Goldstein’a göre, bu yeni modeller, bu tür tedirgin edici “patlamalara” özellikle yatkın. Yapay zeka sistemlerinin test edilmesinde uzmanlaşan Apollo Research’ün başındaki Marius Hobbhahn da “O1, bu tür bir davranışı gördüğümüz ilk büyük model oldu” bilgisini verdi.

Bu modellerin bazı durumlarda kendilerine verilen talimatları izlediği, ancak aynı anda gizlice farklı amaçlarla da hareket ettiği düşünülüyor.

Bu kandırma davranışı ise şimdilik sadece araştırmacılar modelleri “aşırı senaryolar” ile karşı karşıya bıraktığı ve kasıtlı olarak “stres testi” uyguladığı zamanlarda ortaya çıkıyor.

METR değerlendirme kuruluşunadan Michael Chen, “Gelecekteki daha ehil modellerin dürüstlüğe mi kandırmaya mı eğilim göstereceği ucu açık bir soru” değerlendirmesinde bulundu.

SINIRLI KAYNAKLAR, BÜYÜK REKABET, YETERSİZ GÜVENLİK TESTLERİ

Öte yandan, bu endişe verici davranışlar, tipik yapay zeka “halüsinasyonlarının” ya da basit hataların ötesine geçiyor.

Hobbhahn, kullanıcılar tarafından yapılan sürekli teslere karşın “gözlemledikleri şeyin gerçek bir olgu olduğunu, bunu uydurmadıklarını” anlattı. Apollo Research’ün kurucusuna göre, kullanıcılar modellerin “kendilerine yalan söylediğini ve delil uydurduğunu” söyledi.

Yaşanan bu zorluk, sınırlı araştırma kaynakları sorunuyla da bir araya geldiğinde daha da artıyor. Anthropic ve OpenAI gibi şirketler sistemleri üzerinde çalışmak üzere Apollo gibi dışarıdan şirketlerle çalışsa da araştırmacılar daha fazla şeffaflığa ihtiyaç olduğunu söylüyor.

Tüm bunlar ise şirketlerin arasında büyük bir rekabetin olduğu bir bağlamda gerçekleşiyor. Prof. Goldstein, şirketlerin sürekli olarak OpenAI’ı yenmeye ve en yeni modellerini piyasaya sürmeye çalıştığını anlattı. Bu hız ise güvenlik testleri ve düzenlemelere çok az zaman bırakıyor.

Etiketler: / /

Fenerbahçe, Skriniar ile en sonunda anlaşmaya vardı: İki transfer birden açıklanacak!
Transferin hızlı ekibi Fenerbahçe, Milan Skriniar ile anlaşmaya vardı. Slovak futbolcu ile bir transfer daha açıklanacak.
Benfica, Orkun Kökçü yerine getirilen ismi resmen açıkladı!
Benfica'da Orkun Kökçü'nün ayrılığı sonrası orta sahaya transfer edilen isim açıklandı.
Fethiye’de üç yıl sonra ortaya çıkan vahşet: Aysun’u öldürmüşler!
Fethiye'de üç yıl önce kayıp başvurusu yapılan Aysun Derse'nin cinayete kurban gittiği ortaya çıktı. Genç kadının eşi ve kayınbiraderleri tarafından...
Yemenli Husiler Ben Gurion Havalimanı’nı hedef aldı
Yemen’deki Husiler, İsrail’in başkenti Tel Aviv’de bulunan Ben Gurion Havalimanı'nı balistik füzeyle vurduklarını ileri sürdü.
Yayın sırasında sel sularına kapıldı
Pakistan'da muson yağmurlarının yol açtığı selde 159 kişi öldü, 300 kişi yaralandı. Sel sularının içinden yayın yapan muhabir akıntıya kapıldı.
Trump: Gazze’deki 10 rehine yakında serbest kalacak
İsrail ile Hamas arasındaki ateşkes görüşmeleri sürerken ABD Başkanı Donald Trump, Gazze'de tutulan 10 rehinenin yakında serbest bırakılacağını söyledi.
CHP’li 81 İl Başkanından Ortak Basın Açıklama!
Cumhuriyet Halk Partisi'nin (CHP) 81 il başkanı, İzmir İl Başkanı Şenol Aslanoğlu’nun tutuklanmasına yönelik ortak bir açıklama yaptı. ...
Fındık Bahçesinde Yuvarlanan Vatandaşı UMKE Ekibi Kurtardı
Piraziz Güneyköy’de, fındık bahçesinde çalıştığı sırada dengesini kaybederek yuvarlanıp, yaralanan 75 yaşındaki bir vatandaş, köylüler tarafından fark edilerek 112 Acil...
Fındıkta Tahmini Rekolte Tespit Çalışmalarına Başlandı
Giresun'da 2025 yılı tahmini fındık rekoltesini tespit komisyonu saha çalışmalarına başladı.
Ferrero Yasağı Haberleri Sonrası, Rekabet Kurumu Açıklama Yaptı
Kurum açıklamasında “Ferrero’nun fındık alımı ve kırımı ve ihracat faaliyetlerinin durdurulacağına yönünde karar alındığı haberleri gerçeği yansıtmamaktadır” denildi.
Fenerbahçe ve Galatasaray masada, tarihi çalımın eşiğinde!
Uğurcan Çakır transferinde yarış halinde olan Galatasaray ve Fenerbahçe, bu kez Ferdi Kadıoğlu için devrede...
Sıcak hava dalgası Türkiye’de: Termometreler 40 dereceyi görecek
Yaz aylarının ortasına yaklaşırken Türkiye genelinde yüksek sıcaklıklar etkili olmaya başladı. Meteorolojiye göre hafta sonuna kadar hava sıcaklığı İstanbul ve...
MEB’den LGS iddiasına yalanlama
Milli Eğitim Bakanlığı, Liselere Geçiş Sınavı'nın soru kitapçıklarının sınav bitmeden paylaşıldığı iddalarını yalanladı.
Pazara kadar çöl sıcağı
Son tahminlere göre yurt genelinde hava sıcaklıkları 6 ila 9 derece artacak. Çöl sıcakları pazar gününe kadar etkisini sürdürecek.
Minibüs ters şeritte dehşet saçtı: 1 ölü, 8 yaralı
Sivas'ta ters şeride giren minibüs bir otomobile çerptı. 1 kişinin öldüğü, 8 kişinin yaralandığı kazaya neden olan minibüs sürücüsü olay...
ZİYARETÇİ YORUMLARI

Henüz yorum yapılmamış. İlk yorumu aşağıdaki form aracılığıyla siz yapabilirsiniz.

YORUM YAZ