Интервальный вариационный ряд
Если изучаемая случайная величина является непрерывной, то ранжирование и группировка наблюдаемых значений зачастую не позволяют выделить характерные черты варьирования ее значений. Это объясняется тем, что отдельные значения случайной величины могут как угодно мало отличаться друг от друга и поэтому в совокупности наблюдаемых данных одинаковые значения величины могут встречаться редко, а частоты вариантов мало отличаются друг от друга.
Нецелесообразно также построение дискретного ряда для дискретной случайной величины, число возможных значений которой велико. В подобных случаях следует строить интервальный вариационный ряд распределения.
Для построения такого ряда весь интервал варьирования наблюдаемых значений случайной величины разбивают на ряд частичных интервалов и подсчитывают частоту попадания значений величины в каждый частичный интервал.
Интервальным вариационным рядом называют упорядоченную совокупность интервалов варьирования значений случайной величины с соответствующими частотами или относительными частотами попаданий в каждый из них значений величины.
Для построения интервального ряда необходимо:
1. Вопрос о выборе числа и ширины интервалов группировки приходится решать в каждом конкретном случае исходя из целей исследования, объема выборки и степени варьирования признака в выборке.
Приблизительно число интервалов k можно оценить исходя только из объема выборки n одним из следующих способов:
Таблица 1
Объем выборки, n |
25-40 |
40-60 |
60-100 |
100-200 |
Больше 200 |
Число интервалов, k |
5-6 |
6-8 |
7-10 |
8-12 |
10-15 |
2. Обычно предпочтительны интервалы одинаковой ширины. Для определения ширины интервалов h вычисляют:
где xmax и xmin - максимальная и минимальная варианты выборки;
3. Нижняя граница первого интервала xh1 выбирается так, чтобы минимальная варианта выборки xmin попадала примерно в середину этого интервала: xh1 = xmin - 0,5·h .
Промежуточные интервалы получают прибавляя к концу предыдущего интервала длину частичного интервала h:
xhi = xhi-1 +h .
Построение шкалы интервалов на основе вычисления границ интервалов продолжается до тех пор, пока величина xhi удовлетворяет соотношению:
xhi < xmax + 0,5·h .
4. В соответствии со шкалой интервалов производится группирование
значений признака - для каждого частичного интервала вычисляется
сумма частот ni вариант, попавших в i-й интервал. При этом
в интервал включают значения случайной величины, большие или равные нижней границе и меньшие
верхней границы интервала.