Статья

Технологии искусственного интеллекта в работе патентной службы

Интеграция Бизнес-приложения
мобильная версия
, Текст: Наталья Рудычева

Интеллектуальный потенциал страны – ключ к ее успешному экономическому будущему в современном мире. Особо важную роль в наращивании интеллектуальной мощи играет деятельность патентной службы – насколько эффективно организованы ее внутренние бизнес-процессы и взаимодействие с международными патентными службами. Разработки компании PROMT в области искусственного интеллекта помогают работе одной из главных патентных служб страны – «Федеральному институту промышленной собственности» (ФИПС).

По мнению многих экспертов, интеллектуальная собственность, в том числе промышленная собственность (патенты на изобретения, промышленные образцы, товарные знаки), все в большей степени становятся источником конкурентных преимуществ в бизнесе. Одна из основных задач Федеральной службы по интеллектуальной собственности Федерального института промышленной собственности (ФИПС) России — прием и обработка заявок на патенты, включая международные заявки, связанные с поиском схожих патентов в патентных базах разных стран. Эксперты ФИПС получают заявку, ищут и изучают схожие патенты, чтобы убедиться, что заявитель действительно создал ноу-хау, которое не пересекается с чужой интеллектуальной собственностью. Сегодня масштаб поиска ФПИС впечатляет: изучаются собственные и международные базы данных, которые в целом содержат 110 млн патентов с технической информацией на разных языках.

Вот несколько цифр, чтобы представить уровень патентной активности мире. USPTO, аналог ФИПС в США, получает более 500 тыс. заявок в год. С такой же примерно нагрузкой работают патентные службы Китая. Очередь при этом составляет более 1 млн заявок, то есть с момента подачи до момента выдачи патента может пройти от двух до пяти лет в зависимости от сферы изобретения.

В России ситуация пока отличается. ФИПС получает по 50 тыс. заявок в год, и ждать их рассмотрения приходится всего год-полтора – по закону не позже, чем через 18 месяцев заявки на изобретения, прошедшие формальную экспертизу с положительным результатом, должны пройти полную экспертизы и быть опубликованы в официальном бюллетене. Зато темпы роста количества заявок в России в два раза быстрее. На экспертизу уходит примерно два-четыре месяца, но очереди и сроки продолжают расти. В целом по миру, патентная активность растет примерно на 4,7% в год.

Экспертам ФИПС приходится рассматривать самые разные заявки, поэтому компетенция экспертов – один из ключевых вопросов качества проведения экспертизы и скорости рассмотрения заявок. При рассмотрение заявки эксперт должен провести поиск как по российским, так и зарубежным базам данных патентных бюро, по открытым источникам на разных языках. Для того, чтобы вынести экспертное решение о сходстве заявленного изобретения с уже имеющимися патентами в большинстве случаев достаточно понимания сути изобретения в целом без проникновения в детали. Поэтому при работе с иноязычными документами точный, пусть и не идеальный с точки зрения профессионала перевод может многократно увеличить эффективность просмотра огромного числа патентов, хранящихся в базах данных. К тому же нельзя ожидать от патентного эксперта хорошего знания нескольких иностранных языков. Возможность быстро понимать и оценивать тексты на иностранном языке, достаточно сложные в терминологическом и стилистическом плане, формулировать терминологически точные запросы на иностранном (как правило, английском) языке для поиска по зарубежным базам данных, таким как американская USPTO, японская AIPN, базы данных Европейской патентной организации (EPO), Всемирной организации интеллектуальной собственности (WIPO) и другим, является важным преимуществом работы патентного эксперта.

ИТ-помощник для перевода

Для повышения эффективности и точности работы патентной службы с зарубежными базами данных требуется сервис автоматического перевода, адаптированный к переводу патентной документации и интегрированный в рабочую среду патентного эксперта. Может возникнуть вопрос: необходимость в сервисе связана с недостаточным знанием экспертами английского языка или дело в чем-то другом? Для использования автоматического перевода есть несколько объективных предпосылок. Во-первых, это большой объем информации, с которой нужно ознакомиться эксперту: даже при очень хорошем знании языка скорость чтения на родном языке существенно выше, поэтому возможность читать оригинал на иностранном и его перевод на родном языке в несколько раз повышают скорость работы с текстом. Во-вторых, присутствует терминологическая нагруженность текстов: базы данных «не забывают» термины и их переводы, в отличие от человека. В-третьих, патентные эксперты работают не только с информацией на английском языке, но и с другими языками (немецким, испанским, японским и т.д.).

Именно поэтому целью совместного проекта PROMT и ФИПС было создание платформы для перевода, которая решала бы три бизнес-задачи. Во-первых, ИТ-решение должно было предоставлять экспертам мгновенный качественный перевод патентного документа или его фрагмента на русский язык. Во-вторых, запрос эксперта к поисковой системе должен был автоматически переводиться на различные языки для поиска релевантной информации в базах патентов. И наконец, сотрудникам службы требовалась возможность формировать терминологическую базу данных, чтобы постоянно повышать качество перевода патентной информации. Эксперты ФИПС используют перевод в трех основных сценариях работы: при переводе неформатированного текста, получаемого из различных баз данных; при переводе подробных описаний изобретения, которые сохраняются в базах данных как графические файлы (сканы) в форматах PDF, JPEG, TIFF; при переводе запросов в базах данных.

Особенностью реализованной платформы для ФИПС стала уникальная гибридная технология перевода от PROMT, настроенная на работу с текстами в сфере патентования. Эта технология является синтезом традиционного перевода на основе грамматического описания естественного языка (RBMT) и автоматического редактирования полученного автоматического перевода с помощью анализа статистических моделей. Модули для статистического постредактирования были построены на базе профессиональных русско-английских переводов, предоставленных ФИПС.

Платформа перевода сегодня

Платформа перевода, развернутая в ФИПС, дает разнообразные возможности применения автоматического перевода в работе экспертов ведомства.

Перевод фрагмента текста


Источник: PROMT, 2016

При работе с платформой перевода эксперт использует браузер, помещая в специальное окно на странице интересующий его текст и посылая его на сервер платформы перевода. Сервер платформы перевода возвращает переведенный текст в другое окно браузера на той же странице, что и окно с исходным текстом. Эксперт одновременно видит оригинальный текст и перевод.

Перевод документа


Источник: PROMT, 2016

Эксперт может послать на перевод и документ целиком (как правило, представляющий собой графический образ в JPEG, PDF). Так как документ может быть достаточно большим, то чтобы не заставлять эксперта ожидать окончания перевода, этот процесс организован как асинхронный.

Поиск в терминологической базе данных

Эксперту предоставляется возможность по полному или частичному написанию слова или словосочетания получить исчерпывающую информацию обо всех терминах, в которые входит интересующее слово/словосочетание. При этом в строке поиска слово/словосочетание может быть введено в произвольной форме. Формируется информация по всем переводам термина, находящимся в базе, с указанием из какого словаря взят перевод термина, с полной грамматической информацией для термина и перевода.

Терминологическая база данных может расширяться за счет данных, вводимых в систему экспертами ФИПС. Отображение информации может быть настроено таким образом, чтобы пользователь видел все переводы или только те, которые были введены в базу пользователями ФИПС.

Платформа перевода используется не только экспертами ФИПС, но и пользователями международного пилотного проекта по программе Patent Prosecution Highway. Эта программа предназначена для того, чтобы зарубежные ведомства в рамках проекта могли работать с российскими полностью англоязычными документами.

Искусственный интеллект в действии

Еще одной ключевой особенностью платформы является способность платформы PROMT для ФИПС обучаться. Эксперты могут дополнять словари и уточнять варианты перевода, систему перевода можно дополнительно обучать на новых данных (переводах, выполненных человеком) – в результате чего растет интеллект системы перевода, а качество переведенного текста непрерывно улучшается. Надо отметить, что функция обучения системы очень важна, поскольку позволяет использовать «знания» опытных специалистов в работе всех сотрудников.

Сегодня пользователями платформы являются более 600 экспертов ФИПС. По статистике патентной службы, 42% всех поступающих заявок проходят проверку по международным базам данных. Более 90% всех запросов на автоматический перевод – это перевод с английского на русский и наоборот. На долю остальных языков (немецкого, испанского, французского, португальского) приходится около 10%. 78% запросов – это перевод текста, 18% – перевод документов целиком и чуть более 4% перевод сайтов. В среднем за день эксперты делают 800 запросов на перевод, что составляет почти 2500 страниц текста или 625 тыс. слов.

Разработанная платформа перевода успешно используется в ФИПС в течение нескольких лет, пройдя путь от разрозненной закупки десктопных продуктов до клиент-серверной платформы, встроенной в информационную среду организации, постоянно совершенствуясь и давая новые и удобные инструменты для работы с патентной информацией на основных европейских языках. В планах расширения функциональности – подключение китайского и японского языков к платформе перевода. Китай и Япония отличаются высокой активностью в области патентования инноваций, и в этой связи перевод с данных языков будет крайне востребованной опцией.

Использование автоматизированного перевода значительно повысило эффективность работы экспертов, сделав возможным более оперативное и точное рассмотрение патентных заявок.

Четверть века

Сегодня компания PROMT – один из сильнейших игроков на рынке разработок в сфере искусственного интеллекта, недавно компания отметила свое 25-ие. Ее технология перевода используется не только экспертами ФИПС, но и пользователями международного пилотного проекта Patent Prosecution Highway, а также компаниями и государственными службами различных стран. Всего у компании более 15 тыс. клиентов из разных отраслей промышленности, включая такие крупные организации, как NASA, PayPal, TripAdvisor, Amadeus, «Лаборатория Касперского», «Норникель», «Лукойл», «Полиметалл Инжиниринг».

Качество переводов PROMT также высоко оценивается экспертами – переводы по технологиям PROMT с английского на русский неоднократно признались лучшими (по результатам сравнения качества перевода разных систем в рамках семинара под эгидой Американской Ассоциации Компьютерной Лингвистики в 2013-2016гг).