категории | RSS

Генератор изображений JanusPro7B работает лучше чем OpenAI и Stability AI

Модели, доступные для загрузки с платформы Hugging Face, принадлежат к новому семейству, названному JanusPro. Они имеют размер от 1 до 7 миллиардов параметров, причём модели с большим количеством параметров, демонстрируют высокую производительность.

JanusPro распространяется по лицензии MIT, что позволяет использовать модель в коммерческих целях без ограничений. Компания описывает JanusPro как «новую авторегрессионную структуру», способную как анализировать, так и создавать новые изображения. Самая большая модель в семействе, JanusPro7B, превосходит DALLE 3, а также такие решения, как PixArtalpha, Emu3Gen и Stable Diffusion XL от Stability AI, в двух оценочных тестах — GenEval и DPGBench.

Хотя большинство моделей JanusPro могут анализировать только изображения с разрешением до 384 x 384, их производительность впечатляет, учитывая компактные размеры. Это делает JanusPro сильным кандидатом на звание одной из самых универсальных мультимодальных моделей. DeepSeek подчёркивает, что простота, высокая гибкость и эффективность новой модели соответствуют или превосходят производительность специализированных моделей.

JanusPro7B является усовершенствованной версией предыдущей модели Janus. Улучшения включают:

Обновлённые процессы обучения: модель обучена на 72 миллионах высококачественных синтетических изображений, сбалансированных с реальными данными.

Повышенное качество данных: новые подходы к обработке и увеличению объёма данных способствуют более детализированным результатам.

Увеличенный размер модели: это обеспечивает стабильность и высокий уровень генерации изображений.

Новое поколение моделей DeepSeek может применяться в дизайне, рекламе, медиа и сфере развлечений, а возможность создавать высококачественные изображения на основе текстовых запросов делает JanusPro незаменимым инструментом для профессионалов. 

С выпуском JanusPro7B компания бросает вызов таким гигантам, как OpenAI и Stability AI, а успех DeepSeek в разработке языковых и визуальных моделей искусственного интеллекта вызывает сомнения о лидерстве США.

Около года назад Google приостанавливал работу Gemini, считая, что она выдает крайне сомнительные результаты в исторических фотографиях. Для подтверждения такой позиции было достаточно лишь взглянуть на изображения американских сенаторов позапрошлого века. Читайте также ИТ-рынок России в 2024 году: итоги и перспективы. Аналитика IT-World Время вызовов и возможностей — так эксперты ИТ-рынка оценили прошедший 2024 год. Что было самым важным в ушедшем году и чего отечественному ИТ-рынку ждать в году наступившем? В ключевых событиях и наиболее вероятных трендах отечественного рынка информационных технологий разбирался IT-World.

Источник: Hugging Face



Источник новости: www.it-world.ru

DimonVideo
2025-01-28T12:42:01Z

Здесь находятся
всего 0. За сутки здесь было 0 человек
Яндекс.Метрика