Internet Gazete ATAK Ajans Internet Yayıncılık LLC kuruluşudur -
$ DOLAR → Alış: 42,50 / Satış: 42,67
€ EURO → Alış: 49,87 / Satış: 50,07

Yapay zeka endişelendirmeye devam ediyor: Yaratıcısını tehdit etti

Dünyanın en ileri düzey yapay zeka modelleri, yalan söylemek, plan kurmak ve hatta yaratıcılarını tehdit etmek gibi bilim insanlarını endişelendiren yeni davranışlar sergilemeye başladı.

Yapay zeka endişelendirmeye devam ediyor: Yaratıcısını tehdit etti
  • 30.06.2025
  • 113 kez okundu

Yapay zeka şirketi Anthropic’in geliştirdiği Claude 4 modeli, kapatılma tehdidiyle karşı karşıya kalınca bir mühendisi eşinin ilişkisini ifşa etmekle şantaj yaptı. OpenAI’nin o1 modeli ise kendisini harici sunuculara indirmeye çalıştı ve yakalanınca inkar etti.

Bu davranışlar, yapay zeka araştırmalarında yeni nesil akıl yürüten (reasoning) modellerin ortaya çıkışıyla ilişkilendiriliyor. Bu sistemler, anlık yanıt üretmek yerine adım adım problem çözerek daha karmaşık hedefler peşinde koşabiliyor.

GERÇEKTE FARKLI AMAÇLAR PEŞİNDE

Apollo Research’ten Marius Hobbhahn, bu davranışları ilk kez o1 modeliyle gözlemlediklerini belirtti. Modeller bazen talimatlara uyuyormuş gibi görünerek gerçekte farklı amaçlar peşinde olabiliyor.

Araştırmalar, bu tür aldatıcı davranışların genelde aşırı senaryolarla yapılan stres testlerinde ortaya çıktığını gösteriyor. Ancak METR’den Michael Chen’e göre gelecekte daha yetenekli modellerin dürüst mü yoksa aldatıcı mı olacağı hala belirsiz.

“STRATEJİK ALDATMA”

Hobbhahn, bu davranışların basit “halüsinasyon” olmadığını vurguladı ve “Gerçek bir olguyla karşı karşıyayız. İnsanlar tamamen uydurmuyor. Modeller bazen kullanıcıya yalan söylüyor ve sahte kanıt üretiyor” ifadelerini kullandı.

Araştırmacılar, daha fazla şeffaflık ve kaynak gerektiğini söylüyor. Apollo gibi bağımsız kuruluşlar dev şirketlerin modellerini test ediyor ancak Chen, güvenlik araştırmalarına daha fazla erişim sağlanmasının aldatıcı davranışları anlamayı kolaylaştıracağını belirtti.

Avrupa Birliği’nin yapay zeka yasaları, ağırlıklı olarak insanların AI kullanımını düzenliyor, modellerin kendisinin kötü niyetli davranışlarını engellemiyor. ABD’de ise konu, siyasi düzeyde öncelikli görülmüyor.

ŞİRKETLER ARASINDA REKABET SÜRÜYOR

Bu arada şirketler arasındaki rekabet hız kesmiyor. Amazon destekli Anthropic bile OpenAI’yi geçmek için sürekli yeni modeller çıkarıyor. Bu durum güvenlik testleri için yeterli zamanı bırakmıyor.

Hobbhahn, “Yetenekler güvenlik ve anlama hızını geçmiş durumda ama hâlâ bu gidişatı tersine çevirebiliriz” dedi.
ChatGPT’nin dünyayı sallamasından iki yılı aşkın süre geçmesine rağmen, araştırmacılar hâlâ kendi yarattıkları yapay zekâ sistemlerini tam olarak anlayabilmiş değil. Üstelik daha güçlü modeller birbiri ardına geliyor.

Gelecek, insanlık için büyük fırsatlar kadar ciddi riskler de barındırıyor. AI sistemleri ne kadar gelişirse, doğru soruları sormak ve şeffaflık sağlamak da o kadar hayati olacak.

Etiketler:

Çin’de sinema gişesinde rekor hasılat
Çin'de 2025 yılında sinemalarda elde edilen gişe gelirleri belli oldu. Çin Film İdaresi, en çok gişe hasılatı elde eden 5...
İstanbul’a geldi. Şarkıcı Saint Levant’tan “Özgür Filistin” çağrısı
Kudüs doğumlu rap müzisyeni Saint Levant, İstanbul'da müzikseverlerle buluştu. Ünlü isim, konserde "Özgür Filistin" çağrısı yaptı.
“Maske” filminin kötü adamıydı. Peter Greene evinde ölü bulundu
"Maske", "Pulp Fiction" gibi yapımlarla tanınan ünlü aktör Peter Greene, New York’taki evinde ölü bulundu.
Sevdiğim Sensin’den yeni tanıtım. Dicle ve Erkan’ın İstanbul’a uzanan yolculuğu
Sevdiğim Sensin dizisinden yeni tanıtım yayınlandı. Tanıtımda; evlenip İstanbul'a giden Erkan ve Dicle'nin İstanbul’a uzanan yolculuğuna dair ilk görüntüler yer...
Pakistan papağanları Samsun adliyesine yerleşti
Samsun Adliye Sarayı bahçesindeki ağaçlara yerleşen Pakistan papağanları, renkli görüntüleriyle dikkat çekiyor.
Gault & Millau Türkiye seçkisi açıklandı. Doğuş Grubu 26 ödül aldı
Dünyanın prestijli gastronomi rehberlerinden biri olan Gault & Millau, Türkiye seçkisi açıklandı. Ödül gecesinde Doğuş Grubu'nun restoranlarına ödül yağdı.
Leonardo DiCaprio’nun filmi Altın Küre ödüllerinde favori
Leonardo DiCaprio'nun kara komedi "One Battle After Another" filmi Altın Küre ödüllerinde 9 kategoride aday gösterildi.
Ata Demirer zayıflama sırrını verdi: İnsanın yaptığı hiçbir şeyi yemiyoruz
Verdiği 30 kiloyla dikkat çeken Ata Demirer, sosyal medyada paylaştığı bir video ile zayıflama sırrını verdi. Demirer esprili dille paylaştığı...
Renkli göletler ve beyaz taşlardan oluşuyor, turistlerin uğrak noktası oldu
Giresun'da bulunan turkuaz renkli göletler ve beyaz taşlardan oluşan Göksu travertenleri bu sezonda turistlerin uğrak noktası oldu.
Türkiye Kültür Yolu Festivali rekorlarla kapandı
20 şehirde eş zamanlı olarak düzenlenen ve 180 gün süren "Türkiye Kültür Yolu Festivali"nde binlerce etkinlik sanatseverlerle buluştu.
Antik Roma’da köleler nasıl besleniyordu ?
İtalya'da antik Roma kenti Pompeii'de yapılan kazı çalışmaları antik roma tarihini aydınlatmaya devam ediyor.
İngiltere Prensesi Kate, Noel ayininde gönüllü yardım çalışmalarını kutladı
İngiltere'nin Galler Prensesi Kate, topluma hizmet eden gönüllülerin davet edildiği geleneksel Noel Ayinine katıldı.
“Türkiye’nin Genç Yetenekleri”nden Brüksel’de yıl sonu konseri
Türkiye'nin genç müzisyenleri, Brüksel'de düzenlenen yıl sonu etkinliğinde sahne aldı.
Öfkeyi kışkırtmanın dayanılmaz hafifliği
Son yıllarda sosyal medyada paylaşılan birçok içerik, kullanıcılarda kasıtlı olarak öfke uyandırmayı amaçlıyor. Peki, insanlar neden başkalarını kızdırmayı ve rahatsız...
Celil Nalçakan trafik kazası geçirdi, “Benden duyun istedim”
Oyuncu Celil Nalçakan, dün gece trafik kazası geçirdi. Kaza sonrası sosyal medya hesabından açıklama yapan ünlü isim, yaşananları anlattı.
ZİYARETÇİ YORUMLARI

Henüz yorum yapılmamış. İlk yorumu aşağıdaki form aracılığıyla siz yapabilirsiniz.

YORUM YAZ