Turingov test je dugo bio ključni alat za procjenu umjetničke inteligencije, smatrajući da je sustav koji ga uspješno prođe na neki način “ljudski inteligentan”. Međutim, nova studija kognitivnih znanstvenika Camerona Jonesa i Benjamina Bergena s Univerziteta Kalifornija u San Diegu pokazala je da je ovaj test sve manje relevantan kao mjera za procjenu stvarne umjetničke inteligencije.

Studija je obuhvatila testiranje četiri različita LLM-a (jezičnih modela), uključujući ELIZA, GPT-4o, LLaMa-3.1-405B i GPT-4.5. U testu su učesnici prošli osam krugova razgovora, u kojima su istovremeno komunicirali s dva subjekta putem tekstualnih poruka – jedan je bio čovjek, a drugi AI model.

Zadatak je bio da odrede koji je od subjekata čovjek, a koji AI, dok su ih pratili na podijeljenom ekranu tokom interakcije od pet minuta. Ispitanici su u 73% slučajeva smatrali GPT-4.5 ljudskim subjektom, dok je LLaMa-3.1-405B “prevario” ispitivače u 56% slučajeva. Drugi modeli, ELIZA i GPT-4o, uspjeli su zavarati samo 23%, odnosno 21% učesnika.

Ovi rezultati sugeriraju da su GPT-4.5 i LLaMa-3.1-405B uspjeli zavarati ispitivače, što bi značilo da imaju sličnu vrstu inteligencije kao ljudi. Međutim, istraživači tvrde da Turingov test više nije adekvatan alat za procjenu opće umjetničke inteligencije.

Turingov test je prvi put predstavljen od strane engleskog matematičara Alana Turinga 1948. godine u njegovom radu “Inteligentne mašine”. Test je izvorno bio zamišljen kao eksperiment u kojem bi troje ljudi igrali šah s teoretskom mašinom. Turing je kasnije u svojoj publikaciji iz 1950. godine “Computing Machinery and Intelligence” predložio “igru oponašanja” kao način da se ocijeni sposobnost mašine da pokaže inteligentno ponašanje koje je ekvivalentno ljudskom.

Međutim, Turingov test suočava se s nekoliko kritika. Neki istraživači smatraju da prolaženje testa nije nužno znak stvarne inteligencije, već više pokazatelj sposobnosti oponašanja ljudskog ponašanja. Također, Turing je smatrao da je mozak samo mašina, no mnogi znanstvenici osporavaju ovu tvrdnju, što dovodi u pitanje valjanost testa. S obzirom na to da računari nisu ljudi, njihovi procesi donošenja zaključaka možda nisu usporedivi s ljudskim, što dodatno čini test neadekvatnim.

Zbog toga mnogi istraživači smatraju da Turingov test nije legitimni pokazatelj ljudske inteligencije, već samo pokazatelj sposobnosti oponašanja ljudskog ponašanja.