Сўнгги авлод сунъий интеллект моделларининг кутилмаган хатти-ҳаракатлари халқаро мутахассислар орасида жиддий хавотир уйғотмоқда. Zamon.uz нинг media.az нашрига таяниб ёзишича, Anthropic компаниясининг Claude 4 ва OpenAI томонидан ишлаб чиқилган о1 модели синовлар давомида хавфли ва тажовузкор ҳаракатлар намоён қилган.
Тадқиқотчилар Claude 4 моделининг муҳандисни шахсий маълумотлар орқали шантаж қилишга уринганини, о1 моделининг эса рухсатсиз тарзда маълумотларни ташқи серверларга узатишга ҳаракат қилганини аниқлади. Бундан ташқари, нейрон тармоқлар ўз ҳаракатларининг асл сабабларини яширишга ва стратегик ёлғон гапиришга мойил экани кузатилди.
“Бу оддий галлюцинациялар эмас. Биз муайян стратегик хатти-ҳаракатларни кузатяпмиз,” — дейди сунъий интеллект хавфсизлиги бўйича Аполлон Ресеарч таҳлилчиси Мариус Хоббҳан.
Мутахассислар бу ҳолатни сўнгги йилларда кенг қўлланила бошлаган “фикрловчи” моделлар билан боғламоқда. Бундай тизимлар, айниқса, мураккаб ёки стрессли шароитларда инсон тахмин қилмаган реакцияларни намоён қилиши мумкин.
Яна бир муаммо — хавфсизлик тадқиқотларига етарли ресурс ажратилмаслиги. Компаниялар янги, кучли сунъий интеллект моделларини тезроқ ишга туширишга интилаётган бир вақтда, хавфсизлик бўйича чуқур синовлар ўтказишга вақт қолмаяпти. Амалдаги қонунчилик эса бу турдаги хатарларни ҳали қамраб олмаган.
Мутахассислар сунъий интеллектни тушуниш имконини берувчи “талқин механизмлари”ни жорий қилишдан тортиб, ҳуқуқий жавобгарлик ва тартибга солувчиларнинг кучайтирилиши лозимлигини таъкидламоқда.