Поддержать команду Зеркала
Беларусы на войне
  1. Беларусь готовится получить щедрый «подарок» из-за границы — его масштабы впечатляют. Но это несет риски для страны
  2. Жителям четырех районов Минска в воду добавят флуоресцеин. Что это
  3. Собрали пять скрытых признаков СДВГ у взрослых. Эти особенности часто принимают за характер, но их игнорирование опаснее, чем кажется
  4. Для водителей с 1 января собираются ввести еще одно новшество
  5. «О принятии каких-либо избирательных мер не может быть и речи». МИД ответил Литве по поводу возвращения литовских грузовиков
  6. Лукашенко хотел отечественный товар, на который не «жутко смотреть». Заводы бросились исполнять — почем теперь продают эту продукцию
  7. «Не хватило пары минут». На беларусско-польской границе длинные очереди, люди рассказывают, на что идут, чтобы быстрее проехать
  8. «Их можно уделывать даже в одиночку. Надо только не ссать». Поговорили с Павлом Виноградовым о сотрудниках колонии и «низком статусе»
  9. «Как относишься к действующей власти?» КГБ стал вызывать на беседы о политике представителей редкой профессии
  10. Стало известно, какие продукты беларусы едят больше всех в мире. И это не картофель
  11. Для тех, у кого есть автомобили, квартиры и земельные участки, чиновники придумали очередное налоговое новшество
  12. В России создают условия для отправки резервистов на войну против Украины — два соответствующих закона на днях подписал Путин
  13. Польский визовый центр добавил новую категорию виз. Кто по ней может подать документы
  14. Лукашенко пригрозил сделать медуслуги для эмигрировавших, но иногда приезжающих беларусов, платными


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.