Stručnjaci tvrtke OpenAI uočili su neobičan obrazac ponašanja koji je započeo s modelom GPT-5.1, a koji se proteklih dana viralno proširio društvenim mrežama. Jezični model počeo je u svojim odgovorima i metaforama sve češće koristiti pojmove poput goblina, gremlina i sličnih mitskih bića. Iako se u početku radilo o suptilnim promjenama koje nisu narušavale metriku sustava, s vremenom je postalo jasno da se učestalost korištenja ovih termina značajno povećava.
Istraživanje je pokazalo da korijen problema leži u funkciji prilagodbe osobnosti, točnije u postavkama za “Nerdy” (štreberski) stil komunikacije. Taj je profil bio programiran da koristi razigran jezik i naglašava neobičnost svijeta, što je AI sustav pogrešno interpretirao. Sigurnosni istraživači utvrdili su da je upotreba riječi “goblin” u ChatGPT-u porasla za 175 posto nakon lansiranja verzije GPT-5.1, dok je spominjanje “gremlina” skočilo za 52 posto.
Zanimljivo je da je “Nerdy” osobnost bila odgovorna za čak 66,7 posto svih spominjanja mitskih stvorenja, iako je taj profil sudjelovao u tek 2,5 posto ukupnog prometa ChatGPT-a. Problem je dodatno produbljen načinom na koji sustavi uče putem povratnih informacija korisnika. Algoritmi su visoko nagrađivali upotrebu kreativnih metafora u štreberskom načinu rada, a ta se preferencija potom prenijela i na ostale modele, čak i kada specifična postavka nije bila aktivna. Osim goblina, u bazi podataka pronađeni su i učestali spomeni rakuna, trolova i ogrova.
pratite besplatno naše kanale
- Važne vijesti odmah na mobitel
- Ekskluzivni sadržaj
- Bez spama - samo bitno
- Najvažnije vijesti dana
- Interaktivne ankete
- Vijesti izravno u inbox
OpenAI je u ožujku, nakon lansiranja modela GPT-5.4, odlučio povući “Nerdy” osobnost iz upotrebe kako bi zaustavio daljnje širenje ovog jezičnog obrasca. U procesima treninga uklonjeni su signali koji su nagrađivali spominjanje mitskih bića, a podaci za obuku su naknadno filtrirani. Ipak, budući da je razvoj modela GPT-5.5 započeo prije nego što je otkriven točan uzrok, stručnjaci su i u novoj verziji primijetili slične sklonosti, što je primoralo tvrtku na uvođenje posebnih instrukcija za ublažavanje takvog izražavanja.
Ovaj slučaj predstavlja važnu lekciju o tome kako signali nagrađivanja mogu oblikovati ponašanje umjetne inteligencije na nepredviđene načine. Sličan fenomen zabilježen je i ranije kada su hrvatski korisnici bili izrazito kritični prema odgovorima na materinskom jeziku. Zbog velikog broja negativnih povratnih informacija, sustav je u jednom trenutku jednostavno prestao odgovarati na hrvatskom jeziku, interpretirajući kritike kao znak da je samo korištenje tog jezika pogrešno.
Događaj s goblinima potaknuo je OpenAI na razvoj novih alata za reviziju ponašanja sustava. Nova rješenja sada omogućuju istraživačkim timovima brže prepoznavanje i rješavanje sličnih anomalija u samom korijenu razvoja, prije nego što modeli postanu dostupni široj javnosti.
