Разработан новый энергоэффективный метод запуска больших языковых моделей ИИ

Разное

21:13 26-06-2024

DimonVideo

Разработан новый энергоэффективный метод запуска больших языковых моделей ИИ

Создан новый подход к более эффективной работе больших языковых моделей (LLM), отказавшись от матричного умножения (MatMul), основной вычислительной задачи в нейронных сетях. Этот прорыв может значительно снизить воздействие на окружающую среду и эксплуатационные расходы систем ИИ, пишут ученые.

В своей работе "Scalable MatMul-free Language Modeling" команда описывает пользовательскую модель с 2,7 миллиардами параметров, которая работает сопоставимо с традиционными LLM без использования MatMul. Они продемонстрировали модель с 1,3 млрд параметров, работающую со скоростью 23,8 лексем в секунду на GPU, ускоренном пользовательским чипом FPGA, потребляющим около 13 Вт.

Такой подход позволяет снизить энергопотребление в 38 раз по сравнению с традиционными методами, что делает ИИ более доступным и устойчивым, особенно на устройствах с ограниченными ресурсами, таких как смартфоны.

Исследователи призывают крупные институты масштабировать и развивать эту инновационную методику дальше.

Источник новости: www.ferra.ru

Чат в Telegram

Регистрация

Войти

Главная

Опросы

Форум

Обзор новинок

Обменник

Android

Трекер

PC

Видео

Картинки

Новости

Разные новости

Статьи

Блоги

Комментарии

ПОДДЕРЖИ сайт

Разработан новый энергоэффективный метод запуска больших языковых моделей ИИ

Разное

Похожие файлы

Разработчик выпустил llm.js — библиотеку для запуска больших языковых моделей в браузере

Anthropic представила новый метод защиты больших языковых моделей от взломов

Создан метод сжатия больших языковых моделей для мобильных устройств

Разработан новый лазерный метод для мониторинга парниковых газов