Бизнес просит узаконить обмен обезличенными данными для обучения ИИ
Ассоциация больших данных предложила корректировки в нынешнее законодательство, без которых, как считают ее представители, обмениваться датасетами на законных основаниях в России невозможно. Без такого обмена не будут развиваться ИИ-технологии — данных для обучения моделей не хватает.
Передача данных в серой зоне
Ассоциация больших данных (АБД, включает крупные технологические компании, такие как «Яндекс», VK, Сбербанк, «Мегафон», «Ростелеком», МТС и др.) в направленном в Минцифры письме предложила устранить недостатки существующей системы регулирования сферы искусственного интеллекта (ИИ), мешающие обмену данными, пишет «Коммерсант».
В частности, АБД указала на то, что любая передача данных может считаться незаконной без конкретизации порядка отнесения информации к персональным данным (ПД) и сведениям, которые составляют, например, банковскую тайну, если эти данные были обезличены или зашифрованы без возможности восстановления.
«Без этого формально никакая передача данных невозможна и остается в серой зоне, что существенно тормозит развитие аналитики данных и ИИ», — пояснили представители АБД. В соответствии с действующим регулированием в области ПД и конфиденциальной информации, передача данных из контура оператора запрещена, объединение данных, собранных в разных целях, запрещено, обезличивание (даже необратимое) без согласия субъекта запрещено, уточнили они.
Другие недостатки законодательства
Другой проблемой, считают в АБД, является отсутствия единых стандартов открытых API по модели Open Data, что не позволяет обмениваться данными представитеям разных сфер бизнеса — телеком-операторам, маркетплейсам, банкам.
«Такой дисбаланс и отсутствие кросс-отраслевого обмена данными ограничивает циркуляцию, доступность и разнообразие данных, необходимых для обучения моделей ИИ, сдерживает развитие конкуренции, улучшение клиентского сервиса и препятствует появлению новых видов инновационных продуктов, услуг и сервисов на основе данных», — говорится в письме в Минцифры.
Наборы данных (датасеты) должны стать объектом имущественных прав, предлагает АБД. Это позволит реализовать их потенциал в качестве ценного актива и создаст законный рыночный оборот датасетов. Использовать госданные мешает отсутствие «прозрачной и предсказуемой модели» платы за них.
В широком обмене данными заинтересованы не все
Для обучения ИИ на рынке действительно не хватает данных, согласна глава направления по взаимодействию с регуляторами Swordfish Security Альбина Аскерова. Без снятия барьеров к данным генеративный ИИ в России упрется не в качество алгоритмов, а в «сырьевую базу», сказал независимый эксперт по ИИ Алексей Лерон.
Однако предлагаемые изменения могут устроит не всех игроков рынка. Руководитель департамента технической поддержки Hybrid Алексей Штейгер полагает, что идея широкого обмена данными хоть и несет потенциал снижения операционных затрат и устранения дублирующих процессов, может вызвать сопротивление крупных компаний, прежде всего банков и маркетплейсов, для которых данные — это товар и источник конкурентного преимущества.
На еще одну сложность обратил внимание партнер практики технологического консультирования ДРТ Тимофей Хорошев. По его мнению, реализовать инициативы такого масштаба быстро будет сложно: каждый кейс требует отдельного анализа и сопровождения, а экспериментальные режимы в текущем формате часто не успевают за темпом развития технологий.




