категории | RSS

Meta* представляет OMol25 и UMA — новые открытые ИИ-инструменты для молекулярных исследований

Meta выпустила OMol25 — крупнейший на сегодняшний день открытый набор данных для химии на основе ИИ — и представила UMA, универсальную модель ИИ, предназначенную для прогнозирования химических свойств молекул и материалов.

OMol25 содержит данные более чем 100 миллионов высокоточных молекулярных расчётов, что намного превышает объём любого предыдущего открытого набора данных в этой области. По данным Meta, для создания набора данных потребовалось более 6 миллиардов часов работы суперкомпьютеров. Набор данных охватывает широкий спектр молекул, от небольших органических соединений и биомолекул (например, фрагментов белков и сегментов ДНК) до комплексов металлов и электролитов. Он также включает заряженные и спиновые состояния, множественные конформации (пространственные расположения) и химические реакции.

Цель состоит в том, чтобы помочь моделям ИИ понять, как ведут себя молекулы в широком спектре сценариев. OMol25 доступен в открытом доступе для таких целей, как разработка лекарств, материалов для аккумуляторов и катализаторов. Помимо значений энергии и силы, набор данных включает дополнительные сведения, такие как распределение заряда, орбитали и другие химические свойства.

Набор данных OMol25 доступен на сайте Hugging Face.

Наряду с OMol25 компания Meta запускает UMA (универсальную модель атомов) — новую модель искусственного интеллекта, обученную на OMol25 и других наборах данных. UMA может прогнозировать химические свойства на атомном уровне и, по словам Meta, делает это намного быстрее, чем традиционные подходы.

В отличие от более ранних методов, которые требовали создания специализированной модели для каждой задачи, UMA подходит для широкого круга задач — от молекулярного моделирования (например, для разработки лекарств) до исследований в области материалов и катализа. Он построен на основе современных графовых нейронных сетей и использует архитектуру «Смесь линейных экспертов», которая сочетает в себе скорость и высокую точность. В тестовых испытаниях UMA показал результаты, которые ранее были возможны только при использовании специализированных, тщательно настроенных моделей.

С помощью UMA моделирование и расчёты, которые раньше занимали дни, теперь можно выполнить за секунды. Meta утверждает, что это может позволить исследователям проверять тысячи новых молекул на предмет их пригодности в качестве лекарств или материалов для аккумуляторов ещё до того, как потребуется лабораторный синтез.

Модели UMA также доступны на Hugging Face.

Традиционным моделям ИИ обычно требовались большие объёмы обучающих данных для создания новых молекулярных структур. Теперь Meta представляет «совместную выборку» — новый метод, который позволяет моделям ИИ обучаться и предлагать новые структуры даже при отсутствии примеров из реального мира.

Этот метод основан на концепциях теории стохастического управления и использует диффузионные процессы, которые, по словам команды Meta, особенно хорошо подходят для моделирования молекул. Метод сопряжённой выборки позволяет быстро исследовать множество структурных вариантов с помощью всего нескольких вычислений.

В ходе первых испытаний при использовании метода получилось сгенерировать молекулярные конформации, которые не только соответствовали, но и часто превосходили классические программы — особенно для молекул с большим количеством гибких компонентов.

Модель, код и дополнительная информация доступны на Hugging Face и GitHub.

Несмотря на эти достижения, Meta отмечает, что остаются нерешённые проблемы. Некоторые области химии, такие как полимеры, определённые металлы или сложные состояния протонирования, ещё не полностью изучены. Модели ИИ также нуждаются в улучшении способности прогнозировать заряды, вращения и взаимодействия на больших расстояниях.

*Meta и её продукты (Instagram, Facebook) запрещены на территории Российской Федерации

Источник



Источник новости: habr.com

DimonVideo
2025-05-16T02:50:02Z

Здесь находятся
всего 0. За сутки здесь было 0 человек
Яндекс.Метрика