+7 495 229-00-22

Создание БКФ

Для создания БКФ сначала нужно составить ее структуру – рубрикатор или дерево контентных категорий. Такое дерево представляет собой иерархический список с категориями и под-категориями.

Характеристические и частотные термины

Термины, входящие в БКФ разделяются на частотные и характеристические.

Характеристический термин – термин, который единожды встретившись в анализируемом фрагменте информации, 100% свидетельствует о принадлежности его к определенной категории.

Частотный термин – термин, который, при наличии его в анализируемом фрагменте информации, с определенной долей вероятности свидетельствует о принадлежности этого фрагмента к определенной категории.

Затем каждая категория наполняется списком терминов, ключевых слов, словосочетаний и фраз, появление которых в анализируемом фрагменте информации указывает на его принадлежность к определенной контентной категории. После этого для каждого термина / словосочетания устанавливается вес, который этот термин будет иметь при отнесении информации к определенной категории. Решение о том, является ли текст релевантным контентной категории, принимается по результатам сравнения общей суммы веса терминов, найденных в тексте, с порогом релевантности этой категории.

Для обеспечения качественной категоризации БКФ необходимо поддерживать в актуальном состоянии – редактировать изменяющиеся со временем категории, добавлять и/или удалять термины и словосочетания, изменять их вес и др.