Спецпроекты

Новые технологии помогают понять смысл предложений при переводе

AI

Технологии машинного перевода, несмотря на все усилия ученых и разработчиков, по-прежнему далеки от совершенства. Если перевод отдельных слов, как правило, вопросов не вызывает, то с предложениями ситуация все еще очень сложная. Но в MIT сделали важный шаг на пути решения этой проблемы.

Новые подходы для известной проблемы

Группа ученых из MIT, работающая над исследованиями в области обработки естественного языка (Natural language processing, NLP), в начале февраля 2021 г. представила новое решение, которое должно помочь в вопросе адекватного перевода предложений с одного языка на другой без нарушения смысла. В основе программно-аппаратной системы, которая получила название SpAtten лежит специальный компьютер и особый алгоритм обработки языка. Вместо того, чтобы переводить каждое слово в предложении, присваивая им одинаковую важность, SpAtten концентрируется на ключевых словах, что позволяет выявить положительную или отрицательную коннотацию или спрогнозировать, какие слова должны быть следующими.

Ученые ожидают, что методика на базе ИИ позволит добиться более высокого качества перевода при меньших требованиях к вычислительным ресурсам. «Наша система похожа на то, как человеческий мозг обрабатывает язык, — говорит Ханруи Ван, автор статьи и аспирант кафедры электротехники и компьютерных наук. — Люди читают очень быстро и сосредотачиваются только на ключевых словах. Именно эта идея лежит в основе SpAtten».

Архитектура, лежащая в основе SpAtten, обеспечивает высокую степень параллельной обработки данных, что позволяет анализировать множество слов одновременно

Идея применять для переводов NLP не нова, ее начали активно использовать примерно 5-6 лет назад, в том числе для таких платформ как Google BERT и OpenAI GPT-3. Ключевым нововведением механизма, предложенного в MIT, является избирательность — он может делать выводы о том, какие слова или фразы в предложении являются наиболее важными, на основе сравнения со словосочетаниями, с которыми алгоритм ранее сталкивался на этапе обучения. Но, с технической точки зрения, подход требует очень больших вычислительных ресурсов, более того, процессоры общего назначения, которые используются в массовых компьютерах, не обеспечат здесь оптимальную производительность. И проблема будет усугубляться по мере усложнения моделей NLP, особенно для длинных предложений.

Отсекая лишнее

Система SpAtten призвана хотя бы отчасти решить этот вопрос. Исследователи разработали специальный алгоритм на основе таких методов, как «каскадное отсечение» (cascade pruning) и «прогрессивное квантование» (progressive quantization), которые обеспечивают более эффективную обработку данных меньшими усилиями. Архитектура вычислительной системы, лежащей в основе SpAtten, обеспечивает высокую степень параллельной обработки данных, что позволяет анализировать множество слов одновременно. В целом программные и аппаратные компоненты системы подобраны таким образом, чтобы исключить ненужные или неэффективные манипуляции с данными, сосредоточившись только на задачах, необходимых для достижения цели пользователя.

Пока что исследователи разработали только симуляцию аппаратной конструкции SpAtten, которая работает на процессорах общего назначения (специализированный физический чип еще не создан), но согласно полученным результатам, решение дает многократное преимущество в скорости и качестве перевода по сравнению с другими, доступными на рынке.

«Развитие систем перевода на базе ИИ – это наглядный пример того, как меняются роль и возможности человека. Мы используем одну из систем ИИ-переводов у себя в компании уже больше трех лет. Все эти годы система обучается, наши сотрудники поправляют ее, указывают на ошибки. В этом смысле их роль изменилась, задачи стали немного другими. Но также изменились бизнес-процессы, в которых система задействована, — говорит генеральный директор SAS Россия/СНГ Александр Тихонов. – Идея применять возможности искусственного интеллекта для переводов возникла очень давно, но в этой области по-прежнему очень много работы, и в нее вовлечены лингвисты, математики, бизнес-консультанты, специалисты по бизнес-процессам и дата саентисты. Это базовая задача из области коммуникаций и межкультурного взаимодействия, от качества решения которой зависит очень многое, к примеру, дальнейшее развитие голосовых помощников и космических шаттлов, открытия в области истории и этнографии, возможность реализации новых бизнес-моделей и общаться с людьми из любых стран без переводчиков».

Исследователи считают, что SpAtten может быть полезен коммерческим компаниям, которые используют в работе модели NLP. В дальнейшем, планируется перенести успешный опыт в сферу интернета вещей и персональных устройств, поскольку, как отмечает Ханруи Ван: «В будущем многочисленные устройства IoT будут взаимодействовать с людьми посредством голоса и естественных языков».