Рост количества пользователей информационной системы (далее ИС), как правило, приводит к усложнению ролевой модели, моделей предоставления и использования прав (далее Модели) в ИС. Для обеспечения управляемости ИС, при росте количества пользователей, требуется регулярно анализировать и оптимизировать Модели. Для анализа существующих Моделей в ИС предлагается:
- Кластеризовать данные Моделей;
- Провести бизнес/системный анализ Моделей с учетом данных кластеризации и дать рекомендации;
- Внести необходимые корректировки в Модели:
- Для демонстрации методов кластеризации создать тестовые Модели с помощью генератора датафреймов Pandas.
Модели отличаются друг от друга. Поэтому, требуется применять к каждой из них подходящий метод кластеризации. Так, модель предоставления прав предсказуема, потому что обычно находится под контролем системного администратора. Квантом этой модели является квадрига «роль — условия — разрешения — объект». Кластером в этом случае на примере Tessa является правило доступа, а мета-кластером — группы правил, объединённые по определённым критериям. Для анализа этой модели можно отдельно проанализировать существующие кластера (в Tessa это правила доступа) с целью выявления мета-кластеров и отдельно провести анализ модели предоставления разрешений с целью выявления схожих квантилей «роль — условия — разрешения — объект» в разных кластерах (правилах доступа в Tessa).
Ролевая модель, если определяется администратором, также, как и модель предоставления прав, предсказуема. Её квантом является — роль, кластером — групповые роли, а мета-кластером — группы групповых ролей, объединённых по определённым критериям.
Модель использования разрешений (например, на основе данных таблицы ActionHistory в Tessa) менее предсказуема и потому требует анализа с помощью методов кластеризации, минимально ограниченных в условии. Квант этой модели можно будет определить в результате предобработки данных. Кластеры и мета-кластеры получатся в результате кластеризации. Для этой модели характерны большое количество данных. В связи с этим, кластеризация модели использования прав имеет ряд условий:
- Требуется кластеризовать большое количество объектов и признаков. Количество объектов может достигать сотни тысяч и даже сотни миллионов, а признаков до несколько десятков или сотен;
- Требуется предусмотреть возможность формирования разного количества кластеров, разного размера, формы и плотности, т.к. эти параметры, как правило, заранее не известны;
- Требуется обеспечить масштабируемость алгоритма кластеризации и его воспроизводимость.


