При анализе большого количества данных иногда требуется выделить группы значений с минимальным или максимальным отклонением от среднего значения. Для этой задачи подойдёт XYZ-анализ. Основная идея XYZ-анализа состоит в поиске отклонения нормального распределения от среднего значения для нескольких групп данных. Группы значений с минимальным отклонением относятся к категории X, с максимальным к категории Z, а промежуточные к Y. Для XYZ-анализа важно количество используемых в анализе значений. Чем больше значений, тем точнее результат.
Решение для XYZ-анализа
Шаг 1
Сначала все значения делятся на группы. После этого находится нормальное распределение для каждой группы.
Пример в Excel:
A | B | C | D | E | F | G | H | I | |
1 | Перем. | Зн.1 | Зн.2 | Зн.3 | Зн.4 | Зн.5 | Ст.Откл. | ||
2 | A1 | 11 | 12 | 13 | 14 | 15 | 1,414 | ||
3 | B2 | 21 | 22 | 23 | 24 | 25 | 1,414 | ||
4 | C3 | 31 | 32 | 33 | 34 | 35 | 122,417 | ||
5 | D4 | 41 | 42 | 43 | 44 | 45 | 1277,401 | ||
6 | E5 | 51 | 52 | 53 | 54 | 55 | 1,414 |
Решение в Excel
//Ячейки G2... G6
=СТАНДОТКЛОНП(B2:F2)
Результат:
A | B | C | D | E | F | G | H | I | |
1 | Перем. | Зн.1 | Зн.2 | Зн.3 | Зн.4 | Зн.5 | Ст.Откл. | ||
2 | A1 | 11 | 12 | 13 | 14 | 15 | 1,414 | ||
3 | B2 | 21 | 22 | 23 | 24 | 25 | 1,414 | ||
4 | C3 | 31 | 32 | 33 | 34 | 35 | 122,417 | ||
5 | D4 | 41 | 42 | 43 | 44 | 45 | 1277,401 | ||
6 | E5 | 51 | 52 | 53 | 54 | 55 | 1,414 |
Решение в PostgreSQL
SELECT *,
STDDEV(v1, v2, v3, v4, v5) AS stddev
FROM xyz
GROUP BY variable
Результат:
variable | v1 | v2 | v3 | v4 | v5 | stddev | |
0 | A1 | 11 | 12 | 13 | 14 | 15 | 1,414 |
1 | B2 | 21 | 22 | 23 | 24 | 25 | 1,414 |
2 | C3 | 31 | 32 | 33 | 34 | 35 | 122,417 |
3 | D4 | 41 | 42 | 43 | 44 | 45 | 1277,401 |
4 | E5 | 51 | 52 | 53 | 54 | 55 | 1,414 |
Шаг 2
На втором шаге для каждого набора данных расчитывается коэффициент вариации отклонения нормального распределения от среднего значения.
Решение в Excel
//Ячейки H2... H6
=G2/СРЗНАЧ(B2:F2)
Результат:
A | B | C | D | E | F | G | H | I | |
1 | Перем. | Зн.1 | Зн.2 | Зн.3 | Зн.4 | Зн.5 | Ст.Откл. | Коэфф. | |
2 | A1 | 11 | 12 | 13 | 14 | 15 | 1,414 | 0,471 | |
3 | B2 | 21 | 22 | 23 | 24 | 25 | 1,414 | 0,109 | |
4 | C3 | 31 | 32 | 33 | 34 | 35 | 122,417 | 1,345 | |
5 | D4 | 41 | 42 | 43 | 44 | 45 | 1277,401 | 1,579 | |
6 | E5 | 51 | 52 | 53 | 54 | 55 | 1,414 | 0,027 |
Шаг 3
На этом шаге каждая группа данных, в зависимости от коэффициента вариации, относится к одной из категорий X, Y, Z. Наименьшие значения до 0,1 или 10% относятся к категории X, наибольшие значения от 0,25 или 25% к категории Z, остальные промежуточные значения к категории Y.
Решение в Excel
//Ячейки I2... I6
=ЕСЛИ(H2<0,1;"X";ЕСЛИ(H2<0,25;"Y";"Z"))
Результат:
A | B | C | D | E | F | G | H | I | |
1 | Перем. | Зн.1 | Зн.2 | Зн.3 | Зн.4 | Зн.5 | Ст.Откл. | Коэфф. | XYZ |
2 | A1 | 11 | 12 | 13 | 14 | 15 | 1,414 | 0,471 | Z |
3 | B2 | 21 | 22 | 23 | 24 | 25 | 1,414 | 0,109 | Y |
4 | C3 | 31 | 32 | 33 | 34 | 35 | 122,417 | 1,345 | Z |
5 | D4 | 41 | 42 | 43 | 44 | 45 | 1277,401 | 1,579 | Z |
6 | E5 | 51 | 52 | 53 | 54 | 55 | 1,414 | 0,027 | X |
Пример XYZ-анализа в файле Excel.