U najnovijem testiranju koje je provela tvrtka TrackingAI koristeći standardizirani test Mense Norway, umjetna inteligencija dosegnula je nove razine logičkog zaključivanja. Prema podacima za travanj 2026. godine, na samom vrhu ljestvice s identičnim rezultatom od 145 IQ bodova nalaze se “Grok-4.20 Expert Mode” i “OpenAI GPT-5.4 Pro (Vision)”. Ovi rezultati smještaju vodeće modele u kategoriju visoko nadprosječne inteligencije, značajno iznad ljudskog prosjeka.
Odmah iza vodećeg dvojca smjestio se “Gemini 3.1 Pro Preview” s rezultatom od 141 bod, čime se nastavlja trend izrazite konkurencije među tehnološkim gigantima. Stručnjaci ističu kako male razlike u bodovima na samom vrhu ukazuju na to da se najnapredniji modeli sve više konvergiraju, pri čemu nijanse u arhitekturi sustava odlučuju o trenutnom poretku na ljestvici.
Usporedba s prošlom godinom otkriva impresivan tempo razvoja. Dok je u 2025. godini najbolji zabilježeni rezultat iznosio 135 bodova, ovogodišnji skok na 145 bodova potvrđuje da se sposobnost apstraktnog razmišljanja kod umjetne inteligencije razvija velikom brzinom. Ipak, napredak nije ujednačen kod svih proizvođača, pa je tako najbolji Mistralov model ostao na začelju vodeće skupine s rezultatom od 96 bodova.
pratite besplatno naše kanale
- Važne vijesti odmah na mobitel
- Ekskluzivni sadržaj
- Bez spama - samo bitno
- Najvažnije vijesti dana
- Interaktivne ankete
- Vijesti izravno u inbox
Metodologija testiranja temelji se na 35 vizualnih zagonetki koje zahtijevaju prepoznavanje složenih uzoraka. Modeli koji posjeduju vizualne sposobnosti testu pristupaju izravno putem slika, dok se za modele bez tih funkcija pitanja detaljno verbaliziraju. TrackingAI napominje kako se u slučajevima odbijanja odgovora pitanje može ponoviti do deset puta, a kao konačan rezultat u obzir se uzima najnoviji pokušaj.
Iako su ovi rezultati važan pokazatelj napretka, važno je naglasiti kako IQ test mjeri samo jedan segment inteligencije. Benchmark ljestvice poput ove ne obuhvaćaju vještine poput programiranja, pouzdanosti pruženih informacija, korištenja vanjskih alata ili specifičnih performansi u zahtjevnim profesionalnim i znanstvenim područjima.
