Поддержать команду Зеркала
Беларусы на войне
  1. 123 из 400 возможных. Нашли вузы с крайне низкими проходными баллами в этом году — вот где и чему учат на таких специальностях
  2. Александра Герасименя о продаже квартиры в Минске с аукциона: Позвонили владельцу и сказали, что будут отбирать
  3. «Спрячьте деньги». В эфире ОНТ показали, как начальник ОАЦ передал Тихановской сверток перед выездом из Беларуси в августе 2020 года
  4. Власти продолжают «отжимать» недвижимость у уехавших за границу из-за политики. На этот раз — у известной спортсменки
  5. «С началом СВО это вошло в разряд первоочередных задач». Прибыл первый эшелон с российскими военными для участия в «Западе-2025»
  6. Спрашивают про зарплату в Польше, арестовывают мебель. Силовики приходят с обысками к родным участников Дня Воли за границей
  7. Появилось несколько налоговых новшеств — рассказываем подробности
  8. Круглый стол переговоров однажды привел к свержению режима у наших соседей. Как им это удалось и возможно ли это в Беларуси — объясняем
  9. Почему власть боится акций беларусов за рубежом? Спросили у социолога
  10. Что в 2020 году могло пойти иначе? И могло ли? Мнение
  11. Тихановская прокомментировала «Зеркалу» видео, где глава ОАЦ передает ей сверток и говорит, что там деньги
  12. Российские войска продвинулись к крупному украинскому городу — какие действия они могут предпринять дальше
  13. Пропагандист в эфире госТВ перечислил адреса объектов недвижимости, которой владеют некоторые из уехавших за границу беларусов
  14. ОНТ показал фильм, за сцены из которого Лукашенко можно привлечь по целому букету статей УК. Объясняет юрист
  15. Мария Мороз, которую власти вывозили вместе с Тихановской, рассказала, почему до границы с ними ехал глава ОАЦ Павлюченко
  16. В видео госТВ фигурировал якобы начальник охраны штаба Бабарико. Он бывший силовик, отсидевший в тюрьме
  17. Искусство «слива»: что стоит за информацией от источников в Кремле, которая попадает в западные СМИ
  18. Лукашенко рассказал, для кого в Беларуси «денег жалеть не надо». Это не бюджетники, не аграрии, не врачи и не школы с садиками


/

Исследователи из Университета Карнеги-Меллон провели эксперимент, в котором создали виртуальную IT-компанию с сотрудниками-роботами. Даже лучший ИИ-работник смог выполнить только четверть поставленных задач, а остальные показали еще более плачевные результаты, пишет издание Futurism.

Изображение: Pexels
Робот. Снимок носит иллюстративный характер. Фото: Pexels.com

Исследователи создали виртуальную компанию под названием TheAgentCompany, где все позиции — от финансовых аналитиков и программистов до проектных менеджеров — занимали не люди, а ИИ-агенты от Google, OpenAI, Anthropic и Meta. Агент — это модель искусственного интеллекта, которая должна самостоятельно выполнять поставленные задачи, подобно человеку.

Виртуальным сотрудникам поручили обычные офисные задания: работать с файлами, совершать виртуальные экскурсии по новым офисным помещениям и писать отзывы на работу коллег.

Результаты оказались катастрофическими. Лучшей моделью стала Claude 3.5 Sonnet от компании Anthropic, но даже она смогла выполнить лишь 24% поставленных задач. При этом ее работа была крайне неэффективной — в среднем на каждую задачу уходило около 30 шагов и более шести долларов.

Gemini 2.0 Flash от Google тратил на каждую задачу около 40 шагов, но успешно завершал только 11,4% заданий. Худшим «сотрудником» оказался Nova Pro v1 от Amazon, который справился лишь с 1,7% поручений.

Исследователи отметили, что цифровым работникам не хватает здравого смысла, социальных навыков и понимания того, как работать в интернете. ИИ-сотрудники часто придумывали нелепые решения проблем — например, когда один робот не смог найти нужного человека в корпоративном чате, он просто переименовал другого пользователя.

Хотя современные ИИ-модели могут неплохо справляться с некоторыми простыми задачами, итоги этого и других исследований показывают, что они пока не готовы к более сложной работе, с которой легко справляются люди. Во многом это связано с тем, что нынешний «искусственный интеллект» — это, по сути, продвинутая версия предиктивного ввода текста в вашем телефоне, а не разумное существо, способное решать проблемы, учиться на опыте и применять его в новых ситуациях, отмечают авторы.