Alibaba Cloud, подразделение Alibaba Group, занимающееся цифровыми технологиями, представило две языковые модели с открытым исходным кодом (LVLM) - Qwen-VL и Qwen-VL-Chat. Эти модели сочетают в себе функции понимания изображений и текста, поддерживая многораундовые ответы на вопросы на английском и китайском языках.
Qwen-VL может понимать и генерировать текстовые подсказки и изображения, что позволяет ей решать такие задачи, как создание подписей к изображениям и ответы на открытые запросы. Qwen-VL-Chat позволяет расширить возможности взаимодействия, обрабатывая множество изображений и участвуя в сложных многораундовых диалогах.
Переход компании на открытый исходный код направлен на «демократизацию технологий ИИ», делая код моделей, весовые коэффициенты и документацию доступными для ученых, исследователей и предприятий. Доступ к моделям ИИ предоставляет сообщество ModelScope компании Alibaba и платформа для совместной работы Hugging Face. Компании, имеющие значительную базу пользователей, могут даже запросить коммерческую лицензию.
Источник новости: www.ferra.ru