В России разработали систему, которая ускоряет расчет электронной плотности молекул для создания новых лекарств
Ученые из Института AIRI представили решение на стыке квантовой химии и искусственного интеллекта — LAGNet. Нейросеть предназначена для работы с данными, которые используют фармацевты и химики при создании новых лекарственных препаратов. Главная ее задача — расчет электронной плотности молекул.
Электронная плотность — это фундаментальное понятие в химии, которое показывает, как электроны распределяются вокруг атомов в молекуле. Традиционные методы расчета электронной плотности занимают от 2 часов до 2 дней для анализа одной молекулы. Нейросети позволяют проводить эту работу за 5-6 секунд, однако требуют огромных ресурсов для начального обучения модели. Например, для 12 млн молекул нужно около 100 ТБ данных.
LAGNet решает эту проблему, используя решетку Лебедева — математический подход, разработанный в СССР в 1980-е годы для оптимального распределения точек на сфере. Примененный к новой постановке задачи, он сокращает объем данных для обучения в 42 раза и требования к хранилищу — в 8 раз. Благодаря этому вместо 100 ТБ достаточно всего 12,5 ТБ, что делает технологию более доступной. Кроме того, нейросеть обучается в 4 раза быстрее аналогов за счет снижения нагрузки на каналы передачи данных.
Также по сравнению с предыдущей моделью DeepDFT, новое решение показывает лучшую точность при работе с лекарственными молекулами. Она эффективно работает с атомами 3-4 периодов, серой, бромом и йодом, которые входят в формулы многих лекарственных препаратов. Ошибка предсказания у новой нейронной сети в два раза меньше предыдущего решения.
Исследователями LAGNet также может использоваться для визуализации молекул, помогая быстрее и точнее оценивать их характеристики и выявляя самые перспективные варианты для будущих лекарств. Как в ресторане с богатым меню, где аппетитные картинки помогают сделать правильный выбор, так и в молекулярной визуализации графические изображения раскрывают суть и потенциал каждой молекулы.

Пока система не поддерживает некоторые растворы солей, например, препараты лития, и белковые препараты — инсулин, семаглутид. В ближайшее время разработчики планируют расширить покрытие на весь список жизненно необходимых и важнейших лекарственных препаратов.
«Мы соединили проверенные временем математические методы с современным ИИ, чтобы сделать квантовую химию доступнее для реальных задач. В основе предложенной технологии три основных компонента: улучшенная архитектура нейронной сети, новый метод нормализации данных для обучения, старая и хорошо опробованная математическая идея, примененная нами в контексте новой задачи», — сказал Константин Ушенин, старший научный сотрудник группы «Глубокое обучение в науках о жизни» Института AIRI.