Поддержать команду Зеркала
Беларусы на войне
  1. В ОАЭ закончился первый раунд переговоров Украины, России и США
  2. Платежи по ЖКХ вырастут — Лукашенко подписал указ
  3. Мужчина сделал колоноскопию и умер через три недели. Семья написала уже более 10 писем в госорганы
  4. «Если бы беларусский народ победил в 2020-м, российского „Орешника“ не было бы в Беларуси». Зеленский выступил с жесткой речью в Давосе
  5. Минсвязи вводит ограничение скорости для безлимитного мобильного интернета
  6. Минский РНПЦ позвал на работу медсестер и санитарок через Threads. В соцсети спросили о зарплатах и ужаснулись: «Долго вы будете искать»
  7. Белый дом перепутал Бельгию с Беларусью и включил ее в список участников «Совета мира» Трампа
  8. После аварии на теплотрассе Лукашенко заметил очевидную проблему с отоплением. Ее не могут решить по парадоксальной причине — рассказываем
  9. Беларус яро поддерживал «русский мир», но кардинально поменял взгляды. Он рассказал «Зеркалу» историю своей трансформации
  10. «Это куда более крепкий орешек». СМИ узнали еще одну страну, где США рассчитывают сменить власть до конца года
  11. «Люди военкоматам нужны». Эксперты обнаружили новшества в осеннем призыве и рассказали, к чему готовиться тем, кому в армию весной
  12. Эксперты рассказали, как Путин хочет использовать в своих целях созданный Трампом «Совет мира» и где возьмет необходимый миллиард
  13. «Это была рабочая схема». Выдворенная из Беларуси экс-политзаключенная рассказала, как участвовала в фальсификации выборов
  14. Кремль не демонстрирует готовности к компромиссам по Украине — ISW


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.