Alibaba Group представила новый искусственный интеллект (ИИ), способный обрабатывать текст, изображения, аудио и видео прямо на смартфонах и ноутбуках. Это стало очередным шагом компании в развитии генеративного ИИ.
Модель Qwen2.5-Omni-7B имеет 7 миллиардов параметров, что делает ее достаточно компактной для работы на мобильных устройствах и персональных компьютерах. Она умеет анализировать различные типы данных и выдавать результаты в текстовом или аудиоформате в реальном времени.
Alibaba сделала модель открытой для разработчиков — ее можно найти на платформах Hugging Face, GitHub и ModelScope. Также она интегрирована в фирменный чат-бот Qwen Chat.
Компания отмечает, что модель может помочь людям с нарушением зрения, озвучивая описание окружающей обстановки, или, например, давать пошаговые советы по приготовлению еды, анализируя ингредиенты. Это подчеркивает рост спроса на мультимодальные ИИ, которые могут работать не только с текстом.
Источник новости: www.ferra.ru