Перечисленные методы не содержат современных методов обезличивания и анонимизации данных, а скорее относятся к псевдонимизации и не гарантируют низкого риска раскрытия данных, считают в ассоциации. Кроме того, перечень обезличивания должен быть открытым, в противном случае это будет сдерживать развитие технологий повышения конфиденциальности и развитие рынка данных в России, отмечает собеседник.
Предлагаемые Роскомнадзором требования являются стандартными и формализованными, их нарушение слишком легко выявить, чтобы предполагать их несоблюдение, говорит директор департамента расследований T.Hunter Игорь Бедеров. Но среди сложно выполнимых требований РКН Бедеров отметил гарантию невозможности восстановления данных без дополнительной информации: такое требование является важным, но, как показал опыт GDPR (общий регламент по защите данных в ЕС), проблемным. «Зачастую ИТ-компания не может просчитать, как обезличенные данные могут быть использованы третьими лицами. Как показывает практика, по мере сбора больших данных возникают новые возможности для сопоставления обезличенных данных и идентификации субъектов ПД», — уточняет он.
Второе сложно выполнимое требование – это исключение косвенного восстановления, продолжает Бедеров: даже при обезличивании данные могут сохранять структурные связи или статистические закономерности, позволяющие идентифицировать субъекта через анализ контекста или комбинацию с внешними источниками.
В 996-м приказе Роскомнадзора было явно прописано требование обратимости обезличенных данных (деобезличивание), которое отсутствует в новой редакции нормативного акта регулятора, отмечает Лукацкий. «Однако между строк читается, что с использованием дополнительной информации обратное восстановление персональных данных из обезличенных возможно, – говорит он. – Сделать их невосстанавливаемыми возможно, если процесс обработки таких данных не подразумевает деобезличивание, например, в процессе статистической обработки».
Восстановить обезличенные сведения нельзя, если нет оригинального массива данных, говорит технический директор IT-компании HFLabs Никита Назаров. Данные, которые вообще нельзя восстановить, – это синтетика, сгенерированная компьютером информация, но такие массивы данных не подходят для того, чтобы обучать на них ML-модели или тестировать некоторые IT-системы, поясняет Назаров.
Гарантировать, что обезличенные данные невозможно восстановить без дополнительной информации, в целом реально, но все зависит от метода, говорит руководитель ИБ-направления «Телеком биржи» Александр Блезнеков. Если применять криптографические способы, то без ключа данные действительно не вернуть. Полностью исключить возможность восстановления данных нельзя, разве что они полностью уничтожены, подчеркивает он.
В рамках текущих методов РКН полная невосстановимость данных недостижима, говорит Бедеров. По его словам, даже при удалении части данных или их искажении сохраняется риск косвенной идентификации через анализ оставшихся параметров или сопоставление с другими наборами данных. Например, обезличенные биометрические данные (рост, вес) в сочетании с демографической информацией могут быть привязаны к конкретному лицу.