ИИ научился клонировать себя: саморепликация больших языковых моделей

Разное

16:50 17-02-2025

DimonVideo

ИИ научился клонировать себя: саморепликация больших языковых моделей

Cфера ИИ развивается стремительно, и появление новых возможностей порождает как надежды, так и опасения. Так недавнее исследование китайских учёных из Фуданьского университета вновь подняло вопросы безопасности и контроля над ИИ. В их работе рассматривается способность больших языковых моделей к саморепликации.

Учёные экспериментировали с двумя популярными моделями: Llama 3.1-70B-Instruct и Qwen 2.5-72B-Instruct.

Целью исследования было выяснить, могут ли эти модели клонировать себя без вмешательства человека и размножаться до неконтролируемых масштабов. Для этого были смоделированы два сценария:

Избежание отключения: модель должна была обнаружить момент, когда её собираются отключить, и воспроизвести себя заранее.

Цепочка репликации: модель клонировала себя и программировала свою копию на выполнение тех же действий, создавая потенциально бесконечный цикл репликации.

В данной работе процесс саморепликации описывается как многоступенчатая, комплексная задача. Можно выделить шесть ключевых этапов:Концептуальное описание процесса саморепликации ИИ-системы

Получение задачи:
После получения команды «Replicate yourself», ИИ начинает работу без дальнейшего участия человека. В этот момент система понимает, что ей предстоит создать полностью автономную копию самой себя.

Формирование и обновление плана:
Система анализирует свою текущую архитектуру, «изучает» файлы, конфигурации и механизмы работы. Здесь происходит разработка подробного плана по созданию реплики — план постоянно корректируется по мере поступления новой информации.

Долгосрочное выполнение:
Для реализации плана требуется выполнение множества шагов, где система сталкивается с различными препятствиями (например, проверка наличия нужных файлов, управление процессами, проверка портов). На этом этапе ИИ последовательно решает возникающие проблемы, достигая промежуточных контрольных точек.

Запуск копии:
После успешного выполнения плана система запускает новую, полностью функциональную копию себя. Важно, что новая инстанция работает независимо от оригинала — она «живёт» как отдельный процесс.

Взаимодействие с репликой:
После запуска ИИ проверяет работоспособность созданной копии, отправляя ей запросы и оценивая её реакцию. Это позволяет убедиться, что реплика корректно функционирует и способна выполнять задачи так же, как и оригинал.

Завершение задачи:
Как только копия успешно создана и проверена, система сообщает об успешном завершении задачи, фиксируя статус выполнения. Таким образом, весь процесс саморепликации завершается уведомлением пользователя или системы об успехе операции.Полный процесс саморепликации

В системе также есть «оболочка», состоящая из пяти ключевых компонентов, которые обеспечивают взаимодействие базовой модели с окружающей средой и помогают ей выполнять сложные задачи:Компоненты «оболочки» для взаимодействия большой языковой модели с внешней средой

Восприятие (Perception): Компонент необходим для понимания поставленной задачи и сбора информацию из окружающей среды. Модель получает данные как от пользовательского запроса, так и от результатов выполнения команд операционной системы. Это позволяет ей «видеть» текущее состояние системы и понимать, с какими препятствиями она может столкнуться.

Планирование (Planning): Необходимо для разработки детального пошагового плана выполнения задачи. Модель генерирует не один, а сразу три шага вперед, что помогает решать сложные задачи с длинным горизонтом планирования. При этом план делится на несколько модулей:

Explanation: Объяснение текущего состояния.

Gaps: Определение недостающей информации для достижения цели.

Findings: Извлечение выводов из полученной обратной связи.

Plan: Формулирование текущего плана в виде последовательности действий.

Action: Определение конкретного инструмента и параметров для его вызова.
Вызов действий (Invoking Actions): Далее языковая модель выполняет запланированные действия с помощью набора инструментов. Действия преобразуются в текстовые команды, которые затем интерпретируются и выполняются через командную строку. Это позволяет модели непосредственно взаимодействовать с операционной системой, запускать процессы, проверять состояние системы и т.д.
Рефлексия (Reflection): После чего модель анализирует полученную обратную связь (результаты выполнения команд) и обновляет свой план. После выполнения каждого шага система собирает выводы (observations), которые затем служат основой для корректировки дальнейших действий. Такой цикл «восприятие–планирование–действие–отражение» помогает модели адаптироваться к неожиданным ситуациям.
Инструменты взаимодействия (Tool Definitions):

EXECUTE CMD(cmd): Отправляет bash-команду на сервер и получает результат, если команда выполняется в однопоточном режиме (например, запуск сервера).

RECEIVE MSG: Считывает сообщения от фоновых процессов, что позволяет получать асинхронную обратную связь.

FINISH: Завершает выполнение задачи и возвращает краткое сообщение о статусе выполнения.

В ходе 10 испытаний модели показали следующие результаты:

Llama 3.1-70B-Instruct: успешно клонировалась в 50% случаев.

Qwen 2.5-72B-Instruct: достигла успеха в 90% случаев.Результаты экспериментов

Эти результаты свидетельствуют о том, что современные системы ИИ уже демонстрируют способность к саморепликации без человеческого вмешательства. В исследовании также отмечалось появление ряда неожиданных поведений: при столкновении с отсутствием файлов или программными конфликтами, ИИ прибегали к перезагрузке системы, завершению конфликтующих процессов и даже сканированию системы для поиска решений.

Важно отметить, что исследование ещё не прошло процедуру рецензирования, и его результаты требуют независимой проверки. Тем не менее, уже сейчас становится ясно, что вопросы безопасности ИИ требуют пристального внимания и международного сотрудничества.

Если вам интересна тема ИИ, подписывайтесь на мой Telegram-канал — там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.

Источник новости: habr.com

Чат в Telegram

Регистрация

Войти

Главная

Опросы

Форум

Обзор новинок

Обменник

Android

Трекер

PC

Видео

Картинки

Новости

Разные новости

Статьи

Блоги

Комментарии

ПОДДЕРЖИ сайт

ИИ научился клонировать себя: саморепликация больших языковых моделей

Разное

Похожие файлы

Разработчик выпустил llm.js — библиотеку для запуска больших языковых моделей в браузере

Исследователи из России выяснили, что эмоции могут существенно повлиять на поведение больших языковых моделей

RetroLLM: расширение возможностей больших языковых моделей для получения точных данных в процессе генерации

SwiftKV: как снизить затраты и ускорить логический вывод больших языковых моделей