Vaxt.Az

Süni intellekt kritik sınaqdan keçdi

İştirakçıların 73 faizi “Turning” testində insanla robotu ayırd edə bilməyib

Süni intellektli “chatbot”, maşının insan kimi düşünüb-düşünə bilmədiyini anlamaq məqsədi daşıyan bir təcrübə olan “Turing” testindən keçdikdən sonra elm dünyasını heyrətə gətirib.

San Dieqo Kaliforniya Universitetindən iki tədqiqatçı tərəfindən aparılan və hələ də ekspert rəyi üçün təqdim edilməmiş araşdırmada dörd böyük dil modeli (LLM) testə məruz qalıb.

Sınaq nəticəsində “OpenAI” tərəfindən hazırlanmış “GPT-4.5” modeli iştirakçılar tərəfindən 70 faizdən yuxarı nisbətdə insanlardan fərqlənməyib.

İngilis riyaziyyatçısı və kompüter alimi Alan Turinq tərəfindən 1950-ci ildə təklif edilən test, maşının insan kimi düşünüb-düşünmədiyini anlamaq məqsədi daşıyan təcrübə kimi tanınır.

Testdə insan sorğu-sual edən biri insan, digəri isə süni intellekt olan iki həmsöhbətlə yazılı şəkildə ünsiyyət qurur və hansının insan olduğunu ayırd etməyə çalışır.

Əgər sorğu aparan şəxs bu fərqi tapa bilmirsə, testdən keçən sistem “insan kimi intellektə” malik sayılır.

***

Mart ayında nəşr olunan ilkin araşdırmada “ELIZA”, “GPT-4o”, “LLaMa-3.1-405B” və “GPT-4.5” adlı dörd süni intellekt modeli sınaqdan keçirilib. 284 iştirakçıdan ibarət eksperimental qrupda hər bir fərd eyni vaxtda biri insan, digəri isə süni intellekt olan iki “şahid”lə beş dəqiqəlik yazışmalar aparırdı.

Nəticələrə görə, iştirakçılar “GPT-4.5”i insanla müqayisə edilərkən 73 faiz səhv ediblər. “LLaMa-3.1-405B” üçün bu nisbət yüzdə 56 olaraq ölçülsə də, ELIZA və GPT-4o modelləri müvafiq olaraq yalnız yüzdə 23 və 21 faiz insanlarla səhv salınıb.

***

“Turing” testi illərlə süni intellektin “intellektini” ölçmək üçün istifadə edilən simvolik vasitə olsa da, elmi ictimaiyyətdə onun etibarlılığı ilə bağlı tam konsensus yoxdur.

Davranış və düşüncə arasındakı fərq: Bəzi ekspertlər testin yalnız xarici davranışı ölçdüyünü və faktiki düşünmə qabiliyyətini əks etdirmədiyini iddia edirlər.

Beyin maşındırmı? Türinqin beynin mexaniki strukturlarla izah oluna biləcəyi yanaşması bəzi elm adamları tərəfindən qəbul edilmir.

Əməliyyat fərqi: Kompüterlər və insanlar fərqli şəkildə işlədikləri üçün bu proseslərin eyni nəticələrə çatsalar da müqayisə edilə bilməyəcəyi ifadə edilir.

Testin əhatə dairəsi: Tək bir davranışın qiymətləndirilməsinin ümumi zəkanın ölçülməsi üçün kifayət etməyəcəyi fikri önə çıxır.

***

Tədqiqatın müəllifləri “GPT-4.5”in sınaqdan keçdiyini etiraf edir, lakin bunun sistemin insan intellektinə malik olması demək olmadığını vurğulayırlar. Buradakı süni intellektin yalnız “insan kimi görünməyə” müvəffəq olduğu bildirilir.

Tədqiqatın qısa müddəti və müəyyən “şəxsiyyətləri” götürən modellər kimi dəyişənlərin test nəticələrinə təsir edə biləcəyi də ifadə edilir.

Mütəxəssislərin fikrincə, “GPT-4.5” hazırda insanlar qədər ağıllı deyil. Lakin onun bəzi situasiyalarda insanları inandıra biləcək təqlid qabiliyyətinin olması danılmaz faktdır.

16.04.2025

çap et