Большая языковая модель A‑Vibe, разработанная «Авито», заняла первое место среди облегчённых моделей (до 10 млрд параметров) в российском бенчмарке MERA. Модель обошла аналоги от OpenAI, Google и Anthropic, рассказали информационной службе Хабра в пресс‑службе «Авито».
Команда «Авито» разработала собственные генеративные модели A‑Vibe и A‑Vision, использовав на старте открытую модель. Open source модель плохо работала с русским языком, потому что данные включали 100 языков, а русский занимал 1%. Из‑за этого модель слабо понимала и генерировала тексты на русском.
Разработчики провели модификацию и заменили стандартный токенизатор на собственный, ориентированный на русский язык. Это дало два преимущества: ускорение — модель обрабатывает русский текст быстрее до двух раз по сравнению с оригинальной моделью, и повышение качества — понимание и генерация стали значительно лучше.
Благодаря этим изменениям A-Vibe стала лучшей моделью в своём классе для русскоязычного контента по версии MERA. Модель может одновременно обрабатывать до 32 тысяч токенов, что позволяет работать с объёмными текстами.
Старший директор по данным и аналитике «Авито» Андрей Рыбинцев объяснил, что модель была создана с упором на баланс между качеством, скоростью и затратами ресурсов. По словам Рыбинцева, оптимизация под задачи компании помогает рассчитывать на окупаемость инвестиций. «Авито» планирует вложить в GenAI 12 млрд рублей и заработать 21 млрд рублей к 2028 году.
В тестировании MERA A‑Vibe обошла такие модели, как GPT-4o mini, Claude 3.5 Haiku, Gemma 3 27B, Mistral Large и другие. Оценивались разные задачи — от базового понимания текста до сложных лингвистических сценариев.
Согласно результатам:
при генерации кода A‑Vibe показала результат на 25% лучше, чем Gemini 1.5 с 8 млрд параметров;
в диалогах точность выше на 32% по сравнению с Llama 3.1, у которой 405 млрд параметров;
при анализе смысла текста — на 23% точнее, чем Claude 3.5 Haiku.
В сервисе «Авито» A‑Vibe помогает продавцам писать описания и быстрее договариваться о сделках в мессенджере. До конца 2025 года компания планирует запустить ещё 20 новых сценариев. Руководитель разработки больших языковых моделей «Авито» Анастасия Рысьмятова сообщила, что «Авито» рассматривает выпуск A‑Vibe в открытый доступ.
Источник новости: habr.com