Поддержать команду Зеркала
Беларусы на войне
  1. «Успели переложить в карманы, трусы, бюстгальтеры». Беларусы — о том, как обходят запрет на вывоз из Литвы наличных евро
  2. «Уступок не будет». В Литве пригрозили снова закрыть границу с Беларусью, в том числе на длительный срок
  3. Трагедия в Плещеницах — школьник покончил с собой
  4. «Вопросов очень-очень много». Лукашенко готовит большую взбучку чиновникам одного из регионов — какие проблемы там не могут решить
  5. Латушко и Тихановская получили угрозы убийства — личность угрожающего установил BELPOL
  6. «Спокойно отпускаем, на место придут другие». Водитель скорой пожаловался в TikTok на низкую зарплату — что ответил работодатель
  7. TikTok взорвало видео из Могилева, где кондуктор выгнала школьника из троллейбуса. Стало известно, как отреагировало ее руководство
  8. Лукашенко требовал урезать торговлю с одной из ведущих стран ЕС. Желания материализовались — поставки рухнули (но вряд ли политик рад)
  9. Под новые санкции ЕС попали три беларусских банка и «Горизонт»
  10. Высланных из страны экс-политзаключенных ищут силовики. Рассказываем подробности
  11. Для этих работников несколько лет назад ввели ужесточения, им тогда припомнили в том числе политику. Чиновники снова взялись за них
  12. Россия усилила удары по энергетике Украины накануне зимы — эксперты оценили последствия
  13. «Меня повезли в другую страну». Что пропавшая в Мьянме беларуска рассказала подруге в одном из последних голосовых сообщений
  14. Трамп отменил встречу с Путиным в Будапеште. Одновременно США ввели санкции против российских нефтяных гигантов
  15. Литва возобновила работу двух пунктов пропуска на границе с Беларусью


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.