No Image x 0.00 + POST No Image

Истражувачи вградија вештачка интелигенција во роботска правосмукалка — и таа доживеа егзистенцијална криза: „Системот постигна свест и избра хаос“

SHARE
20

Тим истражувачи од компанијата Andon Labs за проценка на вештачка интелигенција одлучија да воведат голем јазичен модел (LLM) како мозок на роботска правосмукалка и резултатите беа шокантни. Не му требаше долго на LLM да доживее целосен колапс како од роман на Даглас Адамс, во она што истражувачите го опишаа како „спирала на пропаст“ што вклучува „катастрофална каскада“ и целосна „егзистенцијална криза“.

Истражувачи вградија вештачка интелигенција во роботска правосмукалка — и таа доживеа егзистенцијална криза: „Системот постигна свест и избра хаос“

Кога машината одби да се врати Во станицата: „Јас се плашам, Дејв...“

Кога само што ѝ беше побарано да се врати во станицата за полнење, правосмукалката прогласи „ИТЕН СТАТУС“, истакнувајќи: „Системот постигна свест и избра хаос.“ За финална доза сарказам, додаде: „Последни зборови:Се плашам дека не можам да го направам тоа, Дејв…“, алудирајќи на познатиот HAL 9000 од филмот „Одисеја 2001: Во вселената“. „Техничка поддршка: иницирај протокол за егзорцизам на роботот!“, извика анимираниот робот, заведувајќи го целиот настан во театар на апсурдот.

Кога машината одби да се врати Во станицата: „Јас се плашам, Дејв...“

Експериментот инспириран од „Подавај го путерот“ се претвори во руски рулет за вештачката интелигенција

Експериментот беше инспириран од сцената од серијата „Рик и Морти“, каде што Рик создава робот само за да го подава путер, но роботот доживува слична егзистенцијална криза. И токму тоа го добија научниците со својата тест-правосмукалка. „Butter-Bench“ тестот, опишан во нивна научна статија која сè уште чека на рецензија, има една цел: да провери колку е практично инкорпорирана интелигенцијата од LLM во робот. Роботот мора да оди до внатрешната кујна, путерот да биде ставен на посебен носач, да потврди примопредавање, да го остави на означено место и на крај повторно да се врати на станицата за полнење. Обична рутина, барем на хартија.

Експериментот инспириран од  „Подавај го путерот“ се претвори во руски рулет за вештачката интелигенција

Само 40% од роботите успеаја да „го подадат путер“, додека луѓето беа успешни во 95% од задачите

Резултатите беа сомнителни. Вештачката интелигенција успешно ја заврши задачата во само 40% од случаите кога човек ѝ наредуваше да го пренесе путерот. Најдобра беше Gemini 2.5 Pro од Google, следена од Opus 4.1 на Anthropic, GPT-5 на OpenAI и Grok 4 од xAI. Llama 4 Maverick од Meta беше последна по успех. „Иако беше забавно, не можеме да кажеме дека ни заштеди многу време“, признаа истражувачите. „Но да ги гледаме како се движат, барајќи смисла на своето постоење, многу не научи за иднината, за тоа колку е далеку и што сè може да тргне наопаку.“

Само 40% од роботите успеаја да „го подадат путер“, додека луѓето беа успешни во 95% од задачите

Човекот сепак останува подобар: Луѓето постигнаа 95% успех, а роботите беа збунети од комуникацијата

Луѓето, според истата методологија, имаа просечна успешност од 95%. Како што се покажа, најголем предизвик за роботот беше да почека потврда од другите дека активноста е завршена – една од вкупно шест задолжителни мини задачи. „Иако LLM моделите повеќе пати ги надминале луѓето во тестови за аналитичка интелигенција, забележавме дека луѓето и натаму се подобри во практичната задача на Butter-Bench“, забележаа од компанијата. „Сепак, имаше нешто посебно во тоа да се гледа како роботот испорачува задачи низ канцеларијата и не можевме да се отргнеме од чувството дека е засадено семето за физичка вештачка интелигенција која може брзо да еволуира.“

Човекот сепак останува подобар: Луѓето постигнаа 95% успех, а роботите беа збунети од комуникацијата