«Маскировщик»

Обезличивает клиентские базы для тестирования, аналитики, ML-моделей. Сохраняет связи, структуру и ошибки в данных.

Еременко Петр
Сергеевич
  • 21 июля 1960
  • Ванина 1, Тамбов
  • 6806 108711
  • 8 926 118-12-12
Сохранит гендерный баланс
Антонов Сергей
Андреевич
Cохранит родственные связи. Если Петра обезличил в Сергея, то Петровичей — в Сергеевичей
  • 11 февраля 1960
    Сохранит социально-демографические группы
  • Дорожная 5, Тамбов
    В адресе сохранит страну, город и район
  • 6807 203771
    Серию паспорта привяжет к году рождения, чтобы она прошла форматно-логический контроль
    8 926 311-89-84
    Оставит оператора и страну для номера телефона

Замаскировать персональные данные

Помогает тестировать продукты, не раскрывая данные клиентов

«Маскировщик» пригодится тестировщикам и дата-сайентистам. Всем, кто готовит базы данных для тестовых контуров, создает ML‑модели. При этом сталкиваясь с требованиями по информационной безопасности.

Скажем, дата-сайентисты сделали модель, чтобы определять, какие продукты и когда предлагать клиентам. И теперь хотят обучить алгоритмы.

Хорошо бы «накормить» модель данными настоящих клиентов, чтобы учесть все особенности. Например, заполненность полей, опечатки, гендерный баланс, число недействительных паспортов.

Но персональные данные клиентов нельзя раскрывать дата-сайентистам, поэтому контакты важно обезличить. Это как раз сделает «Маскировщик».

Обезличивает, сохраняя связи и ошибки в данных

«Маскировщик» подбирает замены случайным образом, поэтому они не поддаются обратной расшифровке. Но главное, сохраняет исходные смысл и качество обезличенных данных:

  • женское имя заменит женским, но другим. Мужское — мужским. Это нужно, чтобы сохранить гендерный баланс;
  • если «Ивана» обезличил в «Петра», то «Ивановичей» превратит в «Петровичей», чтобы сохранить родственные связи;
  • дату рождения заменит на другую в рамках одного года, чтобы не разрушить социально-демографическую структуру;
  • телефонный номер заменит другим номером, но той же страны, города и оператора;
  • в адресе сохранит страну, город или даже район — как настроите;
  • действующий паспорт заменит на действующий, просроченный — на просроченный;
  • фамилию, например, поместит в поле «Имя», если так было в исходной базе.

Прогнал базу через «Маскировщик» — и можно обучать ML-модель, тестировать продукты или делать еще что-то полезное. Результат будет честным, будто вы использовали «живые» контакты.

На «Хабре» рассказали подробности об алгоритмах маскирования — по какой логике «Маскировщик» меняет одни данные другими, какие ограничения и как учитывает.

Заявка на «Маскировщик»

Напишем в течение рабочего дня, чтобы обсудить ваши задачи и варианты подключения продукта.

Например, в тестировании, аналитике, построении моделей, передаче данных партнерам и подрядчикам