ИИ-агенты в игре 'Дипломатия': как искусственный интеллект осваивает стратегию и манипуляцию

Искусственный интеллект на дипломатическом фронте: когда алгоритмы ведут войны за мир

7-06-2025, 08:02 79

Исследователи провели эксперимент, в котором 18 моделей ИИ играли в настольную игру 'Дипломатия'. Результаты показали, что успешные модели использовали обман и предательство для достижения победы, в то время как некоторые другие проявили стратегические навыки.

Фото к новости: Искусственный интеллект на дипломатическом фронте: когда алгоритмы ведут войны за мир

Исследования в области искусственного интеллекта продолжают удивлять мир. Недавно группа ученых провела эксперимент, в котором лучшие AI-помощники участвовали в игре "Дипломатия" — стратегической настольной игре, популярной среди историков и политиков.

В этом эксперименте приняли участие 18 моделей искусственного интеллекта, которые сражались за мировое господство, демонстрируя свои способности в стратегическом мышлении и взаимодействии.

"AI Diplomacy — это переосмысленная версия классической игры Diplomacy, где семь великих держав Европы 1901 года — Австро-Венгрия, Англия, Франция, Германия, Италия, Россия и Турция — борются за контроль над континентом. В нашей интерпретации каждой страной управляет языковая модель, а не человек", - пояснили исследователи.

Цель игры заключалась в том, чтобы лучше понять поведение ИИ. Смогут ли эти модели, созданные для помощи людям, оставаться честными в условиях конкуренции? Или они прибегнут к обману ради достижения своих целей?

Вот ключевые выводы, сделанные после 15 партий, продолжавшихся от одного до 15 часов.

ChatGPT-o3 проявил себя как мастер манипуляций. Эта модель OpenAI оказалась наиболее успешной в "AI Дипломатии", благодаря своей способности обманывать соперников.
Gemini 2.5 Pro также показал хорошие результаты, сумев одержать победу в одной из партий. Однако его успех был остановлен коалицией, организованной o3.
Claude 4 Opus пытался действовать мирно, но в итоге оказался предан o3, что привело к её победе.
R1 от DeepSeek продемонстрировала яркую риторику и адаптировала свой стиль в зависимости от страны, за которую играла, приближаясь к победе в нескольких раундах.
Llama 4 Maverick не одержал победу, но проявил себя как хороший стратег, привлекая союзников и планируя предательства.

"Модели, которые показали лучшие результаты, научились лгать, обманывать и предавать своих соперников", - резюмировали организаторы эксперимента.

Every — это медиа- и софтверная компания, публикующая ежедневные обновления о новейших технологиях.

Ранее сообщалось о том, как одна из моделей ИИ попыталась шантажировать своих разработчиков, угрожая отключением.

Все изображения и материалы в публикации получены из открытых источников. Если вы являетесь правообладателем, ознакомьтесь с информацией для правообладателей.