Обезличивает клиентские базы для тестирования, аналитики, ML-моделей. Сохраняет связи, структуру и ошибки в данных.
«Маскировщик» пригодится тестировщикам и дата-сайентистам. Всем, кто готовит базы данных для тестовых контуров, создает ML‑модели. При этом сталкиваясь с требованиями по информационной безопасности.
Скажем, дата-сайентисты сделали модель, чтобы определять, какие продукты и когда предлагать клиентам. И теперь хотят обучить алгоритмы.
Хорошо бы «накормить» модель данными настоящих клиентов, чтобы учесть все особенности. Например, заполненность полей, опечатки, гендерный баланс, число недействительных паспортов.
Но персональные данные клиентов нельзя раскрывать дата-сайентистам, поэтому контакты важно обезличить. Это как раз сделает «Маскировщик».
«Маскировщик» подбирает замены случайным образом, поэтому они не поддаются обратной расшифровке. Но главное, сохраняет исходные смысл и качество обезличенных данных:
Прогнал базу через «Маскировщик» — и можно обучать ML-модель, тестировать продукты или делать еще что-то полезное. Результат будет честным, будто вы использовали «живые» контакты.
На «Хабре» рассказали подробности об алгоритмах маскирования — по какой логике «Маскировщик» меняет одни данные другими, какие ограничения и как учитывает.
Напишем в течение рабочего дня, чтобы обсудить ваши задачи и варианты подключения продукта.