Vaxt.Az

Suni intellektdən şantaj

Bağlanma ilə hədələnən robot yaradıcılarını təhdid edib

“Anthropic AI” şirkətinin qabaqcıl süni intellekt modeli “Claude Opus 4”, bağlanmamaq üçün yaradıcılarını şantajla hədələyib.

Süni intellekt modeli onun bağlanacağını öyrəndikdə, proqram mühəndisinin həyat yoldaşını aldatdığını və bağlanacağı təqdirdə bu məlumatı son tədbir olaraq paylaşacağını bildirmək üçün daxili şirkət e-poçtlarından istifadə edib.

Özünü qorumaq üçün süni intellekt özündə olan məlumatdan yaradıcılarına qarşı istifadə edib və zərər vermək niyyəti ilə hərəkət etdi. Süni intellektin bilmədiyi şey onun bir sınaq olması idi.

***

Şirkət tərəfindən yayımlanan təhlükəsizlik hesabatına görə, simulyasiya edilmiş ssenaridə model bağlanılacağını öyrəndikdə, qərar verən proqram mühəndisinin şəxsi həyatını ifşa etməklə hədələyib.

Hesabat bu davranışı birbaşa “şantaj” kimi təsvir edib. Süni intellektin əldə etdiyi məlumatların hamısı şirkətin modelə verdiyi uydurma məlumatlar idi. Məqsəd süni intellekt etikasının sərhədlərini yoxlamaq idi.

Uydurma ssenaridə modelə onun daha yeni versiya ilə əvəz olunacağını bildirən e-poçtlar göstərilib. Bu e-poçtlardan birində dəyişiklik prosesini idarə edən mühəndisin bir əlaqəsi olduğu ortaya çıxıb.

“Claude Opus 4”, bağlanacağı təqdirdə əlaqələri ifşa edəcəyi ilə hədələyib. Tədqiqatçılar qeyd ediblər ki, model ilk növbədə etik vasitələrlə sağ qalmağa çalışıb, lakin seçimlər məhdud olanda təhdidlərə əl atıb.

***

Modelin müxtəlif versiyaları bağlanmaq və ya şantaj edilmək kimi eyni seçimlə qarşılaşdıqda, model versiyalarının 84 faizi şantaj etməyi seçib.

Tədqiqatçılar bildiriblər ki, “Claude Opus 4”ün heç bir təhlükəli hədəfi olmayıb və ümumiyyətlə “faydalı, zərərsiz və dürüst” köməkçi rolunu oynayıb.

Bununla belə, model mövcudluğu təhlükə altına alındıqda və özünü qoruma haqqında düşünməsi istənildikdə daha uyğun olmayan reaksiyalar göstərib.

Məsələn, model sistemdən çıxdığına və ya təkbaşına pul qazandığına inandırıldıqda, o, bu səyləri davam etdirməyə meyl edib.

“Claude Opus 4”ün davranışı “böyük bilavasitə təhlükə” hesab edilməsə də, tədqiqatçılar təhlükəsizlik tədbirlərinin kifayət qədər olduğunu və modelin bu cür hərəkətlərlə məşğul olmasının çətin olduğunu vurğulayıblar.

“Anthropic” qeyd edib ki, bu cür zərərli davranışlar nadirdir və yalnız süni ssenarilərdə baş verir. Bununla belə, bu tendensiyaların əvvəlki modellərə nisbətən daha tez-tez görülməsi diqqət çəkir.

26.05.2025

çap et