Разделы

Эксперты заявляют: видеозапись с признанием бен Ладена - оригинал

Как заявили 14 декабря американские эксперты, даже имея в арсенале все достижения современных цифровых технологий, было бы крайне сложно фальсифицировать видеозапись, на которой Усама бен Ладен берет на себя ответственность за совершенные 11 сентября теракты, сообщает AP. Самой большой трудностью было бы имитировать звучание и ритм человеческой речи. Синхронизировать фальшивую звукозапись с существующим видео также было бы нелегко, учитывая, что технология имитации арабской речи находится еще в зачаточном состоянии.
Чи-Лин Ши (Chi-Lin Shih), специалист по языковому моделированию из исследовательских лабораторий Bell Labs компании Lucent Technologies, описал этот процесс как что-то наподобие восстановления разбитой вазы путем склеивания ее по осколкам. Даже если посудину и удастся вновь собрать воедино, пристальный взгляд все равно сможет без труда различить трещины.

Программные утилиты позволяют соединять воедино элементы человеческой речи и вкладывать их в уста желаемого персонажа, однако такая искусственно смоделированная запись не будет звучать естественно для уха профессионала, заявил Кеннет Стивенс (Kenneth Stevens), глава исследовательской лаборатории Массачусетского технологического института (Massachusetts Institute of Technology).

Некоторые воинственно настроенные исламисты в Пакистане и на Среднем Востоке высказывали мнение, что кассета была сфабрикована как повод для развертывания американцами военных действий в Афганистане. Президент Буш расценил такого рода обвинения как "нелепые". Представители президентской администрации подчеркнули, что они намеренно не пытались улучшить качество звука или изображения на кассете, чтобы не давать обвинителям лишнего повода для пересудов.

С развитием технологий речевого синтеза стало возможным имитировать человеческий голос на компьютере. Создатели программы Natural Voices из компании AT&T, к примеру, утверждают, что с ее помощью можно имитировать речь ныне умерших актеров, в частности, Джона Уэйна (John Wayne). После компьютерного анализа достаточного количества записей с голосом актера программа может синтезировать его голос, позволяя создавать реплики, никогда не произносимые актером. Теоретически, то же самое можно было сделать и с голосом бен Ладена, ведь достать подлинные записи с его голосом было бы несложно, заявил Линн Шеперд (Lynn Shepherd), вице-президент корпорации Fonix, софтверной компании из Солт-Лейк-Сити, ведущей разработки в области речевого синтеза. "Если у них было много записей бен Ладена, они могли создать превосходно звучащую речь", - считает г-н Шеперд.

Однако для подобной имитации большинству синтезирующих речь программ нужны десятки часов высококачественной студийной записи, во время которой диктора просят произнести все существующие в языке звукосочетания. "У инженеров уходят месяцы на то, чтобы классифицировать все эти речевые фрагменты, чтобы я мог воспроизвести язык", - заявил Билл Дестефанис (Bill DeStefanis), возглавляющий направление речевых технологий компании ScanSoft из штата Массачусетс. "Идея насчет того, что правительству США удалось сделать это за месяц, совершенно невероятна, - отметил г-н Дестефанис. - Я бы мог подделать короткий обрывок, но не длинную речь".

Дискуссия в метавселенной: ИИ, обмен данными и иммерсивные сценарии
ИТ в банках

Некоторые слова, произносимые бен Ладеном на кассете, нельзя разобрать. Плохое звуковое качество записи речи лидера талибов теоретически может служить маскировкой для подделки, полагают эксперты. Однако, помимо синтеза голоса, имитированную речь нужно было еще синхронизировать с видеоизображением, что также вызывает трудности.

Цифровой "укладкой" звука в изображение занимаются преимущественно киностудии, в том числе и Голливуд. В 2000 году игравший в фильме "Гладиатор" актер Оливер Рид (Oliver Reed) умер еще до окончания съемок, и съемочной группе пришлось смонтировать несколько новых сцен с помощью ранее отснятого материала. По словам г-на Дестефаниса и других экспертов, обмануть натренированный глаз такого рода трюками очень сложно. "Человеческий глаз и ухо очень хорошо подмечают несовпадающие со звуком движения губ", - заметил г-н Шеперд.