Поддержать команду Зеркала
Беларусы на войне
  1. Морозы еще не закончились, а следом может возникнуть новая проблема. К ней уже готовятся в МЧС
  2. Завещал беларуске 50 миллионов, а ее отец летал с ним на вертолете за месяц до ареста — что еще стало известно из файлов Эпштейна
  3. Электричка в Вильнюс и возвращение посольств. Колесникова высказалась о диалоге с Лукашенко
  4. «Лукашенко содержит резерв политзаключенных, чтобы получать больше уступок». В американском Конгрессе прошли слушания по Беларуси
  5. «Тьма на улицах до 19.00 — это фильм ужасов». В Минске (и не только) отключили фонари по распоряжению Лукашенко — в соцсетях споры
  6. 20 лет назад беларус был вторым на Играх в Италии, но многие считали, что его кинули. Рассказываем историю знаменитого фристайлиста
  7. Чиновница облисполкома летом 2020-го не скрывала свою позицию и ходила на протесты — она рассказала «Зеркалу», что было дальше
  8. В странах Европы стремительно растет количество случаев болезни, которую нельзя искоренить. В Беларуси она тоже угрожает любому
  9. Украинские контратаки под Купянском тормозят планы России на Донбассе — ISW
  10. Повышение тарифов ЖКХ перенесено с 1 января на 1 марта
  11. «За оставшихся в Беларуси вступиться просто некому». Как государство хотело наказать «беглых», а пострадали обычные люди
  12. Из Беларуси запускают один из самых длинных прямых автобусных рейсов в ЕС — 1200 километров. Куда он идет и сколько стоит билет
  13. «Только присел, тебя „отлюбили“». Популярная блогерка-беларуска рассказала, как работает уборщицей в Израиле, а ее муж пошел на завод
  14. Москва пугает ядерным конфликтом на фоне споров о гарантиях безопасности Украины — ISW оценил вероятность такого сценария
  15. Лукашенко потребовал «внятный, конкретный, выполнимый» антикризисный план для региона с «ужаснейшей ситуацией»
  16. Одно из самых известных мест Минска может скоро измениться — там готовят реконструкцию


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.