Разделы

ПО

ИИ упростил устоявшиеся алгоритмы решения фундаментальных математических задач

Искусственный интеллект AlphaTensor самостоятельно оптимизировал решения сложнейших математических задач, применив игровые методы.

Альфа-ИИ

Исследователи компании DeepMind в Лондоне продемонстрировали, что ИИ способен «обнаруживать лазейки в фундаментальном типе математических вычислений», превращая поставленную перед ним проблему в разновидность игры и затем решать ее, используя те же методики машинного обучения, с помощью которых другой ИИ той же компании научился обыгрывать людей в шахматы и го.

ИИ смог самостоятельно выработать алгоритмы, используя которые, побил рекорды эффективности вычислений, державшиеся несколько десятилетий. По мнению исследователей, это открывает совершенно новые возможности для производительности вычислений в некоторых областях знаний.

ИИ DeepMind AlphaTensor разрабатывался для того, чтобы производить комплексный набор вычислений, известный как умножение матриц. Как пишет Nature, это включает умножение чисел, упорядоченных по определенным координатным сеткам (матрицам), которые могут представлять собой наборы пикселей в изображения, или атмосферные явления в метеорологических моделях, или внутренние процессы в искусственной нейросети.

kalkulyator_600.jpg
ИИ играючи усовершенствовал решение математических задач с матрицами

Чтобы перемножить две матрицы, математик должен сперва произвести умножение отдельных чисел и затем распределить их определенным образом, чтобы получить результирующую матрицу. В 1969 г. математик Фолькер Штрассен (Volker Strassen) нашел способ перемножить пару базовых (2х2) матриц, используя не восемь, как обычно, а только семь операций умножения. После этого другие математики начали искать новые подобные «лазейки».

Это удалось DeepMind AlphaTensor.

Расчеты как игра

ИИ использует формат машинного обучения, известный как Reinforced Learning— усиленное обучение. Это автономная система самообучения, которая учится методом проб и ошибок. Она выполняет действия с целью максимизации выгоды или, другими словами, учится, стремясь добиться лучшего результата.

В таком формате агент ИИ (нейросеть) учится взаимодействовать со своим окружением с целью поэтапного достижения некоторой цели, например выигрыша в настольной игре. Если успех достигнут, агент получает некоторое усиление — его параметры перенастраиваются так, чтобы повысить вероятность будущего успеха.

AlphaTensor также использует игровой метод под названием «древовидный поиск»: планируя свой следующий ход, ИИ изучает вероятности, получаемые при разных вариантах действий (после «развилок»). Выбирая дальнейший путь по «древовидному поиску», нейросеть предсказывает наиболее перспективные действия на каждой развилке. И пока происходит обучение агента, итоговые результаты каждой пройденной игры используются для донастройки нейросети, усовершенствования «древовидного поиска», и, как следствие, поиска оптимального способа достижения цели.

Каждая игра — это головоломка, начинающаяся с трехмерного тензора — корректно заполненной числовой матрицы. Цель AlphaTensor — низвести все числа до нуля с наименьшим количеством шагов, при ограниченном наборе возможных действий. Каждое такое действие представляет собой вычисление, которое при инверсии комбинирует величины из исходных двух матриц с целью создания новой величины в итоговой матрице.

Александр Краснов, «Лаборатория Числитель»: «Штурвал» автоматизировал практически все, что инженеры и разработчики настраивали вручную
Маркет

Игра требует больших усилий, поскольку на каждом этапе перед агентом стоит выбор из триллионов возможных шагов.

Чтобы упростить AlphaTensor задачу, исследователи продемонстрировали нейросети несколько примеров успеха в такой игре, чтобы ИИ не пришлось начинать с нуля. И поскольку последовательность предполагаемых действий не задается жестко, когда машина находила успешную последовательность шагов, исследователи предлагали ей правильный способ упорядочивания этих действий в качестве дополнительного «учебного пособия».

По следам Штрассена

Исследователи испытывали систему на исходных матрицах 5х5. Во многих случаях AlphaTensor самостоятельно находил те же лазейки, которые раскрыл Штрассен, но в других случаях превосходил все ожидания. Например, при перемножении матриц 4х5 и 5х5 ИИ выработал алгоритм, позволивший ограничиваться 76 отдельными операциями умножения, в то время как прежде считавшийся оптимальным алгоритм требовал 80 таких вычислений. При умножении матриц 11х12 и 12х12 ИИ выявил алгоритм, позволивший проводить только 990 операций умножения вместо 1022.

AlphaTensor также может оптимизировать умножение матриц для некоторых видов аппаратного обеспечения. Исследователи обучали агента на двух разных процессорах, обеспечивая его усиление не только когда он находил возможности уменьшить количество совершаемых действий, но и когда снижал запросы к вычислительным мощностям. Иногда быстродействие одного и того же алгоритма на разных процессорах существенно разнилось.

По мнению исследователей, этот подход можно применять в других видах математических операций, таких как разложение сложных волн или других математических объектов на более простые. В целом такой подход приведет к увеличению быстродействия многих приложений.

«ИИ раз за разом демонстрирует возможности оптимизировать математические вычисления, в том числе самым неожиданным образом, — говорит Дмитрий Гвоздев, генеральный директор компании “Информационные технологии будущего”. — Выявление алгоритмов, позволяющих значительно оптимизировать интенсивные вычисления, — это фактически преобразование математики как таковой. Практические последствия этому будут, скорее всего, грандиозными: матрицы применяются в решении большого количества практических задач не только в математике, но и биологии, физике, технике, химии, экономике, а также маркетинге и психологии. Матрицы также активно применяются в криптографии, и новые достижения ИИ могут позволить реализовать более эффективные алгоритмы защиты данных и многое другое».

Роман Георгиев