Разделы

Безопасность Интернет Веб-сервисы Цифровизация Бизнес-приложения

ЦРУ раскрывает свои секреты

Центральное Разведывательное Управление США представило широкой публике свои технологии "извлечения данных", используемые для поиска информации в текстах, радио- и телепередачах.

Отдел современных информационных технологий, входящий в состав управления науки и техники Центрального разведывательного управления США, продемонстрировал общественности технологии "извлечения данных" ("data mining") , используемые для поиска значимой информации среди огромного количества страниц документов и в радио- и телепередачах на различных языках, сообщила Yahoo! News.

Поиск ведется как по систематизированным, так и по случайным источникам, причем объектами поиска являются тексты в печатных изданиях и в цифровом виде, графические изображения, аудиоинформация на 35 языках. Для отсеивания аудиоинформации используется методика "Oasis", которая распознает речь и превращает ее в текст. При этом технология позволяет отделять мужские голоса от женских, а также голоса, принадлежащие разным людям, и записывать их в виде диалогов.

Методика "Oasis" позволяет выделять из аудиопотока только те голоса или ту конкретную информацию, которая заложена в настройках поиска. Пока существует только англоязычная версия "Oasis", но ЦРУ планирует вскоре создать версии на китайском, арабском и других языках, а также усовершенствовать программу, чтобы она смогла распознавать не только отдельные слова, но и их синонимы и синонимические словосочетания.

Другая компьютерная технология под названием FLUENT позволяет искать информацию в текстовых документах. Эта технология подразумевает поиск по ключевым словам, причем вводится слово или сочетание на английском языке, которое тут же переводится на целый ряд других языков, и найденная информация из базы данных на разных языках поступает исследователю после автоматического перевода.

Александр Бабкин, Газпромбанк: Сейчас иностранные ИБ-решения в Газпромбанке замещены на 65%
безопасность

FLUENT может переводить на английский с китайского, корейского, португальского, русского, сербско-хорватского, украинского и других языков. Еще одна программа, Text Data Mining, позволяет автоматически создавать предметные указатели для текстовых документов, а также получать данные по частоте употребления тех или иных слов в документах.

Все эти технологии ЦРУ уже использует в отслеживании незаконных финансовых операций и наркотрафика.