Большая языковая модель «Авито» обогнала OpenAI и Google в бенчмарке MERA

Разное

22:50 07-04-2025

DimonVideo

Большая языковая модель «Авито» обогнала OpenAI и Google в бенчмарке MERA

Большая языковая модель A‑Vibe, разработанная «Авито», заняла первое место среди облегчённых моделей (до 10 млрд параметров) в российском бенчмарке MERA. Модель обошла аналоги от OpenAI, Google и Anthropic, рассказали информационной службе Хабра в пресс‑службе «Авито».

Команда «Авито» разработала собственные генеративные модели A‑Vibe и A‑Vision, использовав на старте открытую модель. Open source модель плохо работала с русским языком, потому что данные включали 100 языков, а русский занимал 1%. Из‑за этого модель слабо понимала и генерировала тексты на русском.

Разработчики провели модификацию и заменили стандартный токенизатор на собственный, ориентированный на русский язык. Это дало два преимущества: ускорение — модель обрабатывает русский текст быстрее до двух раз по сравнению с оригинальной моделью, и повышение качества — понимание и генерация стали значительно лучше.

Благодаря этим изменениям A-Vibe стала лучшей моделью в своём классе для русскоязычного контента по версии MERA. Модель может одновременно обрабатывать до 32 тысяч токенов, что позволяет работать с объёмными текстами.

Старший директор по данным и аналитике «Авито» Андрей Рыбинцев объяснил, что модель была создана с упором на баланс между качеством, скоростью и затратами ресурсов. По словам Рыбинцева, оптимизация под задачи компании помогает рассчитывать на окупаемость инвестиций. «Авито» планирует вложить в GenAI 12 млрд рублей и заработать 21 млрд рублей к 2028 году.

В тестировании MERA A‑Vibe обошла такие модели, как GPT-4o mini, Claude 3.5 Haiku, Gemma 3 27B, Mistral Large и другие. Оценивались разные задачи — от базового понимания текста до сложных лингвистических сценариев.

Согласно результатам:

при генерации кода A‑Vibe показала результат на 25% лучше, чем Gemini 1.5 с 8 млрд параметров;

в диалогах точность выше на 32% по сравнению с Llama 3.1, у которой 405 млрд параметров;

при анализе смысла текста — на 23% точнее, чем Claude 3.5 Haiku.

В сервисе «Авито» A‑Vibe помогает продавцам писать описания и быстрее договариваться о сделках в мессенджере. До конца 2025 года компания планирует запустить ещё 20 новых сценариев. Руководитель разработки больших языковых моделей «Авито» Анастасия Рысьмятова сообщила, что «Авито» рассматривает выпуск A‑Vibe в открытый доступ.

Источник новости: habr.com

Чат в Telegram

Регистрация

Войти

Главная

Опросы

Форум

Обзор новинок

Обменник

Android

Трекер

PC

Видео

Картинки

Новости

Разные новости

Статьи

Блоги

Комментарии

ПОДДЕРЖИ сайт

Большая языковая модель «Авито» обогнала OpenAI и Google в бенчмарке MERA

Разное

Похожие файлы

Alibaba запускает математические AI-модели, превосходящие разработки OpenAI и Google

OpenAI представляет GPT-4.5: новый рубеж в эволюции языковых моделей

Нейросеть «Авито» обошла ChatGPT и Google в тестах

В GitHub Copilot начали тестировать модель o1 от OpenAI