Разделы

ПО Бизнес Законодательство Искусственный интеллект axenix

Бизнес просит узаконить обмен обезличенными данными для обучения ИИ

Ассоциация больших данных предложила корректировки в нынешнее законодательство, без которых, как считают ее представители, обмениваться датасетами на законных основаниях в России невозможно. Без такого обмена не будут развиваться ИИ-технологии — данных для обучения моделей не хватает.

Передача данных в серой зоне

Ассоциация больших данных (АБД, включает крупные технологические компании, такие как «Яндекс», VK, Сбербанк, «Мегафон», «Ростелеком», МТС и др.) в направленном в Минцифры письме предложила устранить недостатки существующей системы регулирования сферы искусственного интеллекта (ИИ), мешающие обмену данными, пишет «Коммерсант».

В частности, АБД указала на то, что любая передача данных может считаться незаконной без конкретизации порядка отнесения информации к персональным данным (ПД) и сведениям, которые составляют, например, банковскую тайну, если эти данные были обезличены или зашифрованы без возможности восстановления.

«Без этого формально никакая передача данных невозможна и остается в серой зоне, что существенно тормозит развитие аналитики данных и ИИ», — пояснили представители АБД. В соответствии с действующим регулированием в области ПД и конфиденциальной информации, передача данных из контура оператора запрещена, объединение данных, собранных в разных целях, запрещено, обезличивание (даже необратимое) без согласия субъекта запрещено, уточнили они.

Другие недостатки законодательства

Другой проблемой, считают в АБД, является отсутствия единых стандартов открытых API по модели Open Data, что не позволяет обмениваться данными представитеям разных сфер бизнеса — телеком-операторам, маркетплейсам, банкам.

Российскому бизнесу не хватает данных для обучения ИИ

«Такой дисбаланс и отсутствие кросс-отраслевого обмена данными ограничивает циркуляцию, доступность и разнообразие данных, необходимых для обучения моделей ИИ, сдерживает развитие конкуренции, улучшение клиентского сервиса и препятствует появлению новых видов инновационных продуктов, услуг и сервисов на основе данных», — говорится в письме в Минцифры.

Наборы данных (датасеты) должны стать объектом имущественных прав, предлагает АБД. Это позволит реализовать их потенциал в качестве ценного актива и создаст законный рыночный оборот датасетов. Использовать госданные мешает отсутствие «прозрачной и предсказуемой модели» платы за них.

В широком обмене данными заинтересованы не все

Для обучения ИИ на рынке действительно не хватает данных, согласна глава направления по взаимодействию с регуляторами Swordfish Security Альбина Аскерова. Без снятия барьеров к данным генеративный ИИ в России упрется не в качество алгоритмов, а в «сырьевую базу», сказал независимый эксперт по ИИ Алексей Лерон.

Почему open source требует стратегии и какой она должна быть
Цифровизация

Однако предлагаемые изменения могут устроит не всех игроков рынка. Руководитель департамента технической поддержки Hybrid Алексей Штейгер полагает, что идея широкого обмена данными хоть и несет потенциал снижения операционных затрат и устранения дублирующих процессов, может вызвать сопротивление крупных компаний, прежде всего банков и маркетплейсов, для которых данные — это товар и источник конкурентного преимущества.

На еще одну сложность обратил внимание партнер практики технологического консультирования ДРТ Тимофей Хорошев. По его мнению, реализовать инициативы такого масштаба быстро будет сложно: каждый кейс требует отдельного анализа и сопровождения, а экспериментальные режимы в текущем формате часто не успевают за темпом развития технологий.

Анна Любавина