Новости компании
01 июня 2020

Карты под замком: как защитить секретные фотографии компании

Каждая компания хранит массу документов в графическом формате — от чертежей и карт до паспортов сотрудников. О том, как защитить их от мошенников, на примере четырех кейсов рассказал Александр Клевцов, эксперт ГК InfoWatch

Чаще всего разработчики DLP-систем (Data Loss Prevention — системы защиты от утечек чувствительной информации) предлагают защищать скан-копии служебных документов, схемы, карты, паспорта, анкеты и бланки, заполненные от руки и заверенные печатью, с помощью технологий контентного анализа. Они работают на основе систем оптического распознавания — OCR (Optical Character Recognition).

Однако в целом ряде случаев OCR распознает важные документы недостаточно хорошо. Поэтому для защиты разных типов графических объектов были созданы и другие технологии, а иногда для многоуровневой защиты используется комплекс из нескольких технологий. Когда и какие использовать, рассмотрим ниже.

Задача № 1. Защита географических карт и технических чертежей

Безопасность таких данных очень актуальна для государственных предприятий, обслуживающих городскую инфраструктуру, для девелоперских и строительных компаний и, конечно, для корпораций, занятых геологоразведкой. «Пятна», выделенные под застройку, как и карты геологоразведки, — огромная ценность. Утечка даже части такой информации грозит и застройщикам, и компаниям, которые занимаются инфраструктурой, и геологам срывом проектов, в которые вложены огромные деньги. Поэтому компании стремятся контролировать не только перемещение целых карт, но и то, куда, кому и зачем пересылаются или передаются даже самые небольшие их фрагменты.

Особенности. Сотрудники предприятий ТЭКа и девелоперы генерируют и пересылают очень много графического контента — в том числе в свои мобильные офисы, в палаточные городки и вагончики в тайге, полевым сотрудникам и т.д. Нужно учесть и то, что информация геологоразведки часто меняется и уточняется — каждый день или даже час приходят новые данные.

В таких условиях невозможно заранее подготовить «слепки» карт и их фрагментов, чтобы заблаговременно «обучить» систему мониторинга и защиты от утечек конфиденциальной информации распознавать их. Ведь система должна быстро и просто отлавливать пересылку и обмен любыми картами или фрагментами карт, даже пока неизвестными ей, выявлять среди них конфиденциальные и останавливать поток информации прежде, чем он пойдет не туда.

Решение. Нужно создать три географические коллекции карт — карты полностью, их большие и маленькие фрагменты. С этими тремя эталонными коллекциями должна постоянно сверяться DLP-система — так она «научится» распознавать объекты определенного класса.

Такая технология называется «графический классификатор». Она может защитить как географические карты, так и технические чертежи, а также схемы. Более того, с помощью глубокого машинного обучения можно «научить» DLP-систему распознавать изображения по любой другой тематике.

Задача № 2. Защита сканов и фотографий банковских карт

Эта задача очень актуальна для банков и других финансовых организаций, которые работают с персональными и платежными данными клиентов и обязаны по закону защищать эти данные.

Особенности. Самый лакомый кусок для мошенников — это платежные данные, которые можно легко заполучить помощью обычных фотографий. Системы оптического распознавания (OCR) с трудом защищают такие карты из-за низкого качества изображений: мешают полустертые номера, плохо настроенный фокус, неровное кадрирование или тусклый свет. При низком качестве распознавания возможности текстового анализа сводятся к нулю.

Решение. Если нужно настроить защиту от такого вида утечек, используйте технологию «картинка в картинке», которая основана на принципах афинного преобразования. Система с такой технологией может распознать фото и сканы карт вне зависимости от масштаба изображения и качества съемки.

Задача № 3. Защита фотоматериалов, утечка которых грозит репутационными и финансовыми рисками

В области защиты конфиденциальных фотографий приходится решать много нетривиальных задач: предотвращение кражи и слива фотографий производственных аварий, изображений критической инфраструктуры, материалов судебных дел, медицинских фотографий, персональной информации и т.д.

Особенности. DLP-cистема должна отличать конфиденциальные фото от неконфиденциальных. Но блокировать пересылку фото, опираясь лишь на анализ формата или сигнатуры файлов, неэффективно.

Решение. Современные DLP-системы умеют выявлять конкретные конфиденциальные фотографии из массива даже после изменения формата, разрешения, поворота фотографии, затирки логотипов, водяных знаков и т.д. Для этого используется технология копирайтного графического анализа. Она эффективна при работе с фотоархивом любого, даже очень большого объема. Благодаря ей фотобанк постоянно поддерживается в актуальном состоянии, потому что как только появляются новые конфиденциальные фотографии, их «слепки» автоматически добавляются в DLP.

Задача № 4. Защита сканов и фотографий паспортов и других персональных документов

Решение. В случае с такими задачами эффективно работает комплекс технологий. Например — оптическое распознавание текста в комбинации с технологией графического классификатора.

Графический классификатор «обучается» на заранее сформированной эталонной коллекции. После того как классификатор отработал на широкой коллекции скан-копий паспортов, в дело вступает еще одна технология — пост-фильтр для лиц. Она дополнительно ищет лицо человека на паспорте. Кроме того, корректируются повороты и масштабы, убираются монотонные поля и «шумы», выпрямляется экспозиция. Такая комбинация серьезно снижает количество ложноположительных срабатываний до минимума (0,01%), а ее настройка предельно проста.

Например, чтобы защитить документ, подтверждающий личность гражданина определенной страны (так называемый MyKAD — удостоверение на пластиковой карте), нужно объединить технологии, которые используют при детекции паспортов и банковских карт. В результате получится «гибрид», который подойдет для определенной задачи. Чем шире количество технологий, которые компания готова применить для защиты, тем больше возможностей найти идеальный способ обеспечить безопасность практически любого типа информации.

 

Материал подготовлен "РБК Pro"

Подпишитесь на рассылку INFOWATCH
l.12-.057c.834-.407 1.663-.812 2.53-1.211a42.414 42.414 0 0 1 3.345-1.374c2.478-.867 5.078-1.427 7.788-1.427 2.715 0 5.318.56 7.786 1.427z" transform="translate(-128 -243)"/>