Продукты InfoWatch для анализа и защиты информации основаны на уникальных технологиях собственной разработки, таких как, например, тщательно оптимизированная технология лингвистического анализа.
Статья - "Как повысить точность детектирования конфиденциальной информации"
Технология лингвистического анализа, разработанная компанией InfoWatch, позволяет успешно решить задачу надежной категоризации и защиты неструктурированных данных.
В оличие от других технологий, успешно работающих с упорядоченными данными (данными, имеющими строго определенную четкую структуру, хранящимися в специализированных репозиториях, имеющими однозначные метки), лингвистический анализ позволяет точно категоризировать данные, предназначенные для человеческого восприятия, хранящиеся большей частью в коммуникационных каналах и составляющими, по оценкам экспертов, до 80% всей информации в современных компаниях.
Технология лингвистического анализа позволяет автоматически определять тематику и степень конфиденциальности анализируемого фрагмента информации на основании встречающихся в нем терминов и их сочетаний. Эта технология используется в продукте InfoWatch Traffic Monitor и обеспечивает высокую надежность и эффективность работы решения.
Лингвистический анализ выполняется на основе заранее созданной базы контентной фильтрации (БКФ) - выделенного на основе сложных статистичесикх и математических методов иерархического списка категорий, который содержит слова и выражения, наличие которых в анализируемом документе позволяет определить его тематику и степень конфиденциальности.
Надежность и точность идентификации конфиденциальных данных в корпоративных информационных потоках с помощью технологии лингвистического анализа зависят от базы контентной фильтрации, на основе которой осуществляется анализ.
Поэтому важно использовать БКФ, учитывающую специфику деятельности компании и поддерживать ее в актуальном состоянии.
Помимо предустановленной стандартной базы контентной фильтрации, содержащей наиболее общие категории и термины, продукт InfoWatch Traffic Monitor позволяет использовать специализированные отраслевые БКФ. Такие отраслевые БКФ, разработанные InfoWatch на основе многолетнего сотрудничества с компаниями различных отраслей, тщательно оптимизированы под потребности конкретных сегментов рынка (финансовый, нефтегазовый, телекоммуникационный и другие секторы). Использование этих баз позволяет достигать высокой точности определения конфиденциальной информации сразу после запуска системы.
Отраслевые БКФ доступны как отдельный компонент, либо могут быть созданы для конкретного заказчика с помощью специального инструмента - InfoWatch Autoliguist.
InfoWatch Autolinguist - уникальный инструмент для создания собственной базы контентного анализа
Для организаций, заинтересованных в создании БКФ, полностью учитывающей специфику их деятельности без допуска посторонних лиц к своей информации, компания InfoWatch разработала дополнительный программный продукт – InfoWatch Traffic Monitor Автолингвист.
С помощью InfoWatch Автолингвист создание собственной базы контентной фильтрации происходит за несколько минут: достаточно просто загрузить в продукт подготовленные документы; а для актуализации БКФ не нужен выделенный специалист: достаточно по мере появления загружать в программу новые документы. Выделение терминов и обновление базы происходит автоматически.