Разработчики архива научных работ Arxiv Labs интегрировали в сервис alphaXiv OCR-модель от Mistral, которая анализирует PDF-документы и пересказывает сложные статьи. Сервис доступен бесплатно.
В 2024 году команда архива научных работ Arxiv Labs запустила сервис alphaXiv. В нём пользователи могут изучать статьи, комментировать их, оценивать и общаться с авторами исследований. В середине марта разработчики рассказали, что реализовали функцию, которая упрощает процесс изучения статей.
Разработчики интегрировали OCR-модель от Mistral, которая анализирует PDF-документ и переводит его в обычный текст. После этого текст обрабатывает языковая модель Claude 3.7, которая кратко пересказывает научную работу простым языком. На выходе получается статья на пару страниц с графиками, схемами, таблицами и примерами кода, если они есть в исходном документе.Научная статья слева и её пересказ справа.
Для пересказа научной статьи надо перейти на страницу работы и открыть вкладку Blog. Также к каждой статье можно оставить публичный комментарий и приватную заметку. Во вкладке Ask AI пользователи могут задать вопросы языковой модели, чтобы уточнить непонятные фрагменты. На выбор доступны модели Gemini 2, Claude 3.7, Claude 3.7 Thinking и GPT-o3 mini.
Источник новости: habr.com