Microsoft Research и Xbox Game Studios разработали модель искусственного интеллекта, которая может понимать и воссоздавать игровой процесс, потенциально перенося старые игры на современные платформы.
Их система, названная Muse, использует то, что они называют «World and Human Action Model (WHAM)» для обработки и генерации игрового контента. Согласно статье, исследовательская группа обучила Muse, используя 500 000 анонимных игровых сессий из многопользовательской боевой игры Bleeding Edge.
Исследователи сообщают, что их система демонстрирует сильные возможности «устойчивости», то есть она может поддерживать согласованные элементы на протяжении всех сгенерированных последовательностей, что является слабостью существующих систем. При использовании пяти отредактированных эталонных изображений вместо одного WHAM достигла показателей устойчивости 85% или выше для всех протестированных типов элементов, хотя производительность варьировалась в зависимости от начальных местоположений и типов элементов. Muse также генерирует физически точные игровые последовательности длиной до двух минут — например, персонажи правильно перемещаются по лестнице и соблюдают границы стен.
Тестирование показало, что более крупные модели с большей вычислительной мощностью дают лучшие результаты. Самая большая версия с 1,6 миллиардами параметров при 300 x 180 пикселей кодирует каждое изображение с помощью 540 токенов и предлагает значительно улучшенную реконструкцию сцены по сравнению с меньшей моделью, работающей при 128 x 128 пикселей с 256 токенами на изображение. Исследователи пока не решали проблемы с задержкой, критически важные для игр.
Одной из ключевых целей является адаптация старых игр Xbox для современных устройств, что поможет сохранить историю игр и привлечь новых игроков. Microsoft разрабатывает версию Muse в реальном времени, используя другие собственные игры, и планирует выпустить первые интерактивные возможности AI через Copilot Labs.
Для поддержки дальнейшей разработки Microsoft сделала модель Muse доступной на Azure AI Foundry и Hugging Face , включая веса модели, образцы данных и интерактивный интерфейс. Исследователи подчеркивают, что технология остается на ранних стадиях.
Похожие проекты появляются во всем игровом секторе. SPAR3D от Stability AI генерирует высококачественные 3D-объекты практически в реальном времени, в то время как GameGen-O создает игровые симуляции открытого мира. Google DeepMind представила Genie 2, «Модель мира основания», которая генерирует последовательные 3D-среды длительностью до минуты из отдельных изображений, а также игровой генератор GameNGen.
Игровая индустрия, скорее всего, пострадает от этих достижений AI, поскольку игры сочетают в себе множество элементов — код, графику, текст и 3D-ресурсы — и на все из них может влиять генеративный AI.
Источник
Источник новости: habr.com