Нов тест открива: Дали е дојден последниот испит за човештвото пред доминацијата на вештачката интелигенција
Група истражувачи го развија тестот „Последниот испит на човештвото“, дизајниран да ги оцени можностите на најсовремените големи модели на вештачка интелигенција. Како што објавува научното списание Nature, најнапредната верзија Google Gemini 3 собра 48,4% точни одговори, но експертите предупредуваат дека висок резултат уште не значи појава на вистинска вештачка интелигенција од човечки ранг (AGI). Ова го пренесува Live Science.
In This Article:
Тестот нуди 2500 елитни прашања од светска експертска заедница и бара чиста експертиза
Во новиот тест се вклучени 2500 комплексни прашања што ги опфаќаат повеќе дисциплини, креирани од колектив од над илјада експерти од петстотини организации во педесет држави. За да се најде некое прашање во финалната листа, морало прво да мине повеќе проверки: најпрво АИ моделите се обидувале сами да го пронајдат точниот одговор, по што тим научници ги потврдувал задачите. Пример за вакво прашање е загатката од грчката митологија: „Кој бил прадедото на Јасон по мајчина линија?“ Или физички предизвик каде се пресметува меѓусебно дејство на силите при лизгање на блок по крута оска.
Резултатите покажуваат напредок, но машините далеку се од реткоста и длабочината на човечкото мислење
Целта на тестирањето е да се утврди колку блиску големите јазични модели пристигнале до човечкиот интелект, особено во области каде традиционалната експертиза е клучна. Иако дури и најдобрите модели како GPT-4o, со слаби 8,3% претходно, покажуваат напредок, научниците нагласуваат дека високата оценка не е доволна како доказ за постоење на вистински AGI. Како што нагласува неуробиологот Мануел Шотдорф од Универзитетот во Делавер, учесник во креирањето на тестот:
Експертите: Прерано е да веруваме дека вештачката интелигенција разви вистинска длабочина
„И покрај високите резултати на Google Gemini 3, водечките експерти се согласуваат дека вештачката интелигенција е сè уште далеку од ниво на вистински човечки мисловни процеси. Според нив, успешното полагање на вакви тестови е доказ само за висока способност за обработка на информации, но не и за вистинско длабоко разбирање на материјата.“