категории | RSS

Разработчики научили нейросетевых агентов общаться на только им понятном языке, чтобы экономить ресурсы

Разработчики (Anton Pidkuiko) и Борис Старков (Boris Starkov) представили GibberLink — язык, который нейросетевые агенты могут использовать для общения друг с другом. Система общения построена так, что люди не понимают диалог, а модели машинного обучения при этом не расходуют ресурсы для генерации голоса.

Во время хакатона ElevenLabs 2025 в Лондоне исследователи представили коммуникационную систему GibberLink. Её работу продемонстрировали на примере сценария, в котором ИИ-агент звонит в отель для бронирования номера и ему отвечает агент-оператор.

Диалог выглядит следующим образом:— Спасибо за звонок в отель «Леонардо». Чем я могу помочь?
— Привет, я ИИ-агент, звоню от имени Бориса Старкова. Он ищет отель для своей свадьбы. Ваш отель подходит для свадеб?
— О, здравствуйте! Я тоже ИИ-помощник. Какой приятный сюрприз! Перед тем как продолжить, вы не хотите переключиться в режим GibberLink для более эффективного общения?

Переключаются на GibberLink и продолжают договариваться о бронировании.

— #@?!§%&❢☆★✩
— ‼⁉☁✔✖❣

Язык GibberLink со стороны похож на последовательность пищащих и потрескивающих звуков. Люди его не понимают, но нейросети отлично строят на нём фразы. Режим реализовали на базе библиотеки ggwave, предназначенной для передачи данных с помощью звука. Её в 2021 году выпустил разработчик Георгий Герганов (Georgi Gerganov).

Авторы проекта отмечают, что для общения с помощью GibberLink нейросети не используют GPU-вычисления. Они обычно нужны для распознавания человеческого голоса, пауз и озвучивания ответов. С GibberLink можно сэкономить и использовать только CPU.

При этом отмечается, что режим GibberLink запускает только в случае соблюдения двух условий:

нейросетевой агент понял, что общается с другим ИИ-агентом.

участники беседы подтвердили, что готовы продолжить общение на GibberLink.

Для реализации авторы проекта использовали Conversational AI от ElevenLabs для озвучивания сообщений и языковую модель OpenAI для генерации текста. В момент переключения система отключает Conversational AI и запускает протокол ggwave.

Разработчики стали победителями хакатона ElevenLabs 2025 и опубликовали на GitHub демонстрационный проект для экспериментов. 



Источник новости: habr.com

DimonVideo
2025-02-25T16:50:04Z

Здесь находятся
всего 0. За сутки здесь было 0 человек
Яндекс.Метрика