Анализ вариационных рядов. Определение вариационных рядов

Статистические ряды распределения представляют собой упорядоченное расположение единиц изучаемой совокупности на группы по группировочному признаку.

Различают атрибутивные и вариационные ряды распределения.

Атрибутивный - это ряд распределения, построенный по качественным признакам. Он характеризует состав совокупности по различным существенным признакам.

По количественному признаку строится вариационный ряд распределения. Он состоит из частоты (численности) отдельных вариантов или каждой группы вариационного ряда. Данные числа показывают, насколько часто встречаются различные варианты (значения признака) в ряду распределения. Сумма всех частот определяет численность всей совокупности.

Численности групп выражаются в абсолютных и относительных величинах. В абсолютных величинах выражается числом единиц совокупности в каждой выделенной группе, а в относительных величинах - в виде долей, удельных весов, представленных в процентах к итогу.

В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды распределения. В дискретном вариационном ряде распределения группы составлены по признаку, изменяющемуся дискретно и принимающему только целые значения.

В интервальном вариационном ряде распределения группиро-вочный признак, составляющий основание группировки, может принимать в определенном интервале любые значения.

Вариационные ряды состоят из двух элементов: частоты и варианты.

Вариантой называют отдельное значение варьируемого признака, которое он принимает в ряду распределения.

Частота - это численность отдельных вариант или каждой группы вариационного ряда. Если частоты выражены в долях единицы или в процентах к итогу, то их называют частостями.

Правила и принципы построения интервальных рядов распределения строятся по аналогичным правилам и принципам построения статистических группировок. Если интервальный вариационный ряд распределения построен с равными интервалами, частоты позволяют судить о степени заполнения интервала единицами совокупности. Для проведения сравнительного анализа заполненности интервалов определяют показатель, который будет характеризовать плотность распределения.

Плотность распределения - это отношение числа единиц совокупности к ширине интервала.

Вариационными называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами считаются отдельные значения признака, которые он принимает в вариационном ряду, т е. конкретное значение варьирующего признака. Частоты - это численности отдельных вариантов или каждой группы вариационного ряда, т. е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем.

Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.

В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды.

Как известно, вариация количественных признаков может быть дискретной (прерывной) или непрерывной.

В случае дискретной вариации величина количественного признака принимает только целые значения. Следовательно, дискретный вариационный рядхарактеризует распределение единиц совокупности по дискретному признаку. Примером дискретного вариационного ряда является распределение семей по числу комнат в отдельных квартирах, приведенное в табл. 3.12.

В первой колонке таблицы представлены варианты дискретного вариационного ряда, во второй - помещены частоты вариационного ряда, а в третьей - показаны частости.

В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенных пределах любые значения, отличающиеся друг от друга на сколько угодно малую величину. Построение интервальных вариационныхрядов целесообразно прежде всего при непрерывной вариации признака, а также если дискретная вариация проявляется в широких пределах, т. е. число вариантов дискретного признака достаточно велико. В табл. 3.3 представлен интервальный вариационный ряд.

Графическое изображение рядов распределения

Анализ рядов распределения можно проводить на основе их графического изображения. Линейчатые и круговые диаграммы строятся для отображения структуры совокупности.

Применяются вместе с диаграммами и такие линии, как полигон, кумулята, огива, гистограмма. При изображении дискретных вариационных рядов используется полигон.

Полигон - ломаная кривая, строится на основе прямоугольной системы координат, когда по оси Х откладываются значения признака, а по оси У - частоты.

Гладкая кривая, соединяющая точки - это эмпирическая плотность распределения.

Кумулята - ломаная кривая, строящаяся на основе прямоугольной системы координат, когда по оси Х откладываются значения признака, а по оси У - накопленные частоты.

Для дискретных рядов на оси откладываются сами значения признака, а для интервальных - середины интервалов.

На основе гистограмм можно строить диаграммы накопленных частот с последующим построением интегральной эмпирической функции распределения.

    Все значения изучаемого свойства, которые встречаются в изучаемой совокупности, называет значением признака (вариантом, вариантой), а изменение этого значения варьированием . Варианты обозначают малыми буквами латинского алфавита с соответствующими порядковому номеру группы индексами - x i .

    Число, которое показывает, сколько раз встречается каждое значение признака в изучаемой совокупности частотой и обозначают f i . Сумма всех частот ряда равна объему изучаемой совокупности.

    Очень часто нужно подсчитать накопленную частоту (S ). Накопленная частота для каждого значения признака показывают, сколько единиц совокупности имеют значение признака не больше, чем данное значение. Накопленная частота исчисляются путем последовательного прибавления к частоте первого значения признака частот следующих значений признака:

Накопленную частоту начинают рассчитывать с самого первого значения признака

Сумма частостей всегда равна единице или 100 %. Замена частот частостями позволяет сопоставлять вариационные ряды с разным числом наблюдений.

Частоты ряда (f i) в некоторых случаях могут быть заменены частостями (ω i).

Если вариационный ряд дан с неравными интервалами, то для правильного представления о характере распределения необходимо произвести расчет абсолютной или относительной плотности распределения.

    Абсолютная плотность распределения (р f ) представляет собой величину частоты, приходящейся на единицу размера интервала отдельной группы ряда:

р f = f / i.

    Относительная плотность распределения (р ω ) представляет собой величину частости, приходящейся на единицу размера интервала отдельной группы ряда:

р ω = ω / i.

Для рядов с неравными интервалами только эти характеристики дает более правильное представление о характере распределения, чем частота и частость.

    Статистическим распределением выборки называют перечень вариантов (значений признака) и соответствующих им частот или плотностей распределения, относительных частот или относительных плотностей распределения.

Разные ряды распределения характеризуются разным набором частотных характеристик:

минимальным – атрибутивные ряды (частота, частость),

для дискретных используются четыре характеристики (частота, частость, накопленная частота, накопленная частость),

для интервальных – все пять (частота, частость, накопленная частота, накопленная частость, абсолютная и относительная плотности распределения).

  1. Правила построения интервального вариационного ряда

  1. Графическое изображение вариационных рядов

Первым этапом изучения вариационного ряда является построение его графического изображения. Графическое изображение вариационных рядов облегчает их анализ и позволяет судить о форме распределения. Для графического изображения вариационного ряда в статистике строят гистограмму, полигон и кумуляту распределения.

Дискретный вариационный ряд изображается в виде так называемого полигона частот.

Для изображения интервального ряда применяются полигон распределения частот и гистограмма частот.

Строятся графики в прямоугольной системе координат.

Метод группировок позволяет также измерить вариацию (изменчивость, колеблемость) признаков. При относительно малом числе единиц совокупности вариация измеряется на основе ранжированного ряда единиц, образующих совокупность. Ряд называется ранжированным, если единицы расположены по возрастанию (убыванию) признака.

Однако ранжированные ряды довольно малопоказательны тогда, когда необходима сравнительная характеристика вариации. Кроме того, во многих случаях приходится иметь дело со статистическими совокупностями, состоящими из большого числа единиц, которые практически трудно представить в виде конкретного ряда. В связи с этим для первоначального общего ознакомления со статистическими данными и особенно для облегчения изучения вариации признаков исследуемые явления и процессы обычно объединяют в группы, а результаты группировки оформляют в виде групповых таблиц.

Если в групповой таблице имеется всего две графы - группы по выделенному признаку (варианты) и численности групп (частоты или частости), она называется рядом распределения.

Ряд распределения - простейшая разновидность структурной группировки по одному признаку, отображенная в групповой таблице с двумя графами, в которых содержатся варианты и частоты признака. Во многих случаях с такой структурной группировки, т.е. с составления рядов распределения, начинается изучение исходного статистического материала.

Структурная группировка в виде ряда распределения может быть превращена в подлинную структурную группировку, если выделенные группы будут охарактеризованы не только частотами, но и другими статистическими показателями. Главное предназначение рядов распределения - изучение вариации признаков. Теорию рядов распределения подробно разрабатывает математическая статистика.

Ряды распределения делят на атрибутивные (группировка по атрибутивным признакам, например деление населения по полу, национальности, семейному положению и т.д.) и вариационные (группировка по количественным признакам).

Вариационный ряд представляет собой групповую таблицу, которая содержит две графы: группировку единиц по одному количественному признаку и численность единиц в каждой группе. Интервалы в вариационном ряду образуются обычно равные и закрытые. Вариационным рядом является следующая группировка населения России по величине среднедушевых денежных доходов (табл. 3.10).

Таблица 3.10

Распределение численности населения России по величине среднедушевых доходов в 2004-2009 гг.

Группы населения по величине среднедушевых денежных доходов, руб./мес

Численность населения в группе, в % к итогу

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Свыше 25 000,0

Все население

Вариационные ряды в свою очередь подразделяются на дискретные и интервальные. Дискретные вариационные ряды объединяют варианты дискретных признаков, изменяющихся в узких пределах. Примером дискретного вариационного ряда может служить распределение российских семей по числу имеющихся детей.

Интервальные вариационные ряды объединяют варианты либо непрерывных признаков, либо изменяющихся в широких пределах дискретных признаков. Интервальным является вариационный ряд распределения населения России по величине среднедушевых денежных доходов.

Дискретные вариационные ряды на практике применяются не слишком часто. Между тем составление их несложно, поскольку состав групп определяется конкретными вариантами, которыми реально обладают изучаемые группировочные признаки.

Более широко распространены интервальные вариационные ряды. При их составлении возникает сложный вопрос о количестве групп, а также о величине интервалов, которые должны быть установлены.

Принципы решения этого вопроса изложены в главе о методологии построения статистических группировок (см. параграф 3.3).

Вариационные ряды представляют собой средство свертывания или сжатия многообразной информации в компактную форму, по ним можно составить достаточно ясное суждение о характере вариации, изучить различия признаков явлений, входящих в исследуемую совокупность. Но важнейшее значение вариационных рядов состоит в том, что на их основе исчисляются особые обобщающие характеристики вариации (см. главу 7).

​ Вариационный ряд – ряд, в котором сопоставлены (по степени возрастания или убывания) варианты и соответствующие им частоты

​Варианты – отдельные количественные выражения признака. Обозначаются латинской буквой V . Классическое понимание термина "варианта" предполагает, что вариантой называется каждое уникальное значение признака, без учета количества повторов.

Например, в вариационном ряду показателей систолического артериального давления, измеренного у десяти пациентов:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

вариантами являются только 6 значений:

110, 120, 130, 140, 160, 170.

​Частота – число, показывающее, сколько раз повторяется варианта. Обозначается латинской буквой P . Сумма всех частот (которая, разумеется, равна числу всех исследуемых) обозначается как n .

    В нашем примере частоты будут принимать следующие значения:
  • для варианты 110 частота Р = 1 (значение 110 встречается у одного пациента),
  • для варианты 120 частота Р = 2 (значение 120 встречается у двух пациентов),
  • для варианты 130 частота Р = 3 (значение 130 встречается у трех пациентов),
  • для варианты 140 частота Р = 2 (значение 140 встречается у двух пациентов),
  • для варианты 160 частота Р = 1 (значение 160 встречается у одного пациента),
  • для варианты 170 частота Р = 1 (значение 170 встречается у одного пациента),

Виды вариационных рядов:

  1. простой - это ряд, в котором каждая варианта встречается только по одному разу (все частоты при этом равны 1);
  2. взвешенный - ряд, в котором одна или несколько вариант встречаются неоднократно.

Вариационный ряд служит для описания больших массивов чисел, именно в этой форме изначально представляются собранные данные большинства медицинских исследований. Для того, чтобы охарактеризовать вариационный ряд, рассчитываются специальные показатели, в том числе средние величины, показатели вариабельности (так называемой, дисперсии), показатели репрезентативности выборочных данных.

Показатели вариационного ряда

1) Средняя арифметическая - это обобщающий показатель, характеризующий размер изучаемого признака. Средняя арифметическая обозначается как M , представляет собой самый распространенный вид средней. Средняя арифметическая рассчитывается как отношение суммы значений показателей всех единиц наблюдения к числу всех исследуемых. Методика расчета средней арифметической различается для простого и взвешенного вариационного ряда.

Формула для расчета простой средней арифметической:

Формула для расчета взвешенной средней арифметической:

M = Σ(V * P)/ n

​ 2) Мода – еще одна средняя величина вариационного ряда, соответствующая наиболее часто повторяющейся варианте. Или, если выразиться по другому, это варианта, которой соответствует наибольшая частота. Обозначается как Мо . Мода рассчитывается только для взвешенных рядов, так как в простых рядах ни одна из вариант не повторяется и все частоты равны единице.

Например, в вариационном ряду значений частоты сердечных сокращений:

80, 84, 84, 86, 86, 86, 90, 94;

значение моды составляет 86, так как данная варианта встречается 3 раза, следовательно ее частота - наибольшая.

3) Медиана – значение варианты, делящей вариационный ряд пополам: по обе стороны от нее находится равное число вариант. Медиана также, как и средняя арифметическая и мода, относится к средним величинам. Обозначается как Me

4) Среднее квадратическое отклонение (синонимы: стандартное отклонение, сигмальное отклонение, сигма) - мера вариабельности вариационного ряда. Является интегральным показателем, объединяющим все случаи отклонения вариант от средней. Фактически, отвечает на вопрос: насколько далеко и как часто варианты распространяются от средней арифметической. Обозначается греческой буквой σ ("сигма") .

При численности совокупности более 30 единиц, стандартное отклонение рассчитывается по следующей формуле:

Для малых совокупностей - 30 единиц наблюдения и менее - стандартное отклонение рассчитывается по другой формуле:

Совокупность значений изученного в данном эксперименте или наблюдении параметра, проранжированных по величине (возрастания или убывания) называется вариационным рядом.

Предположим, что мы измерили артериальное давление у десяти пациентов с целью получить верхний порог АД: систолическое давление, т.е. только одно число.

Представим, что серия наблюдений (статистическая совокупность) артериального систолического давления в 10-ти наблюдениях имеет следующий вид (табл. 1):

Таблица 1

Составляющие вариационного ряда называются вариантами. Варианты представляют собой числовое значение изучаемого признака.

Построение из статистической совокупности наблюдений вариационного ряда - только первый шаг к осмыслению особенностей всей совокупности. Далее необходимо определить средний уровень изучаемого количественного признака (средний уровень белка крови, средний вес пациентов, среднее время наступления наркоза и т.д.)

Средний уровень измеряют с помощью критериев, которые носят название средних величин. Средняя величина - обобщающая числовая характеристика качественно однородных величин, характеризующая одним числом всю статистическую совокупность по одному признаку. Средняя величина выражает то общее, что характерно для признака в данной совокупности наблюдений.

Общеупотребительными являются три вида средних величин: мода (), медиана () и среднеарифметическая величина ().

Для определения любой средней величины необходимо использовать результаты индивидуальных наблюдений, записав их в виде вариационного ряда (табл. 2).

Мода - значение, наиболее часто встречающееся в серии наблюдений. В нашем примере мода = 120. Если в вариационном ряду нет повторяющихся значений, то говорят, что мода отсутствует. Если несколько значений повторяются одинаковое количество раз, то в качестве моды берут наименьшее из них.

Медиана - значение, делящее распределение на две равные части, центральное или срединное значение серии наблюдений, упорядоченных по возрастанию или убыванию. Так, если в вариационном ряду 5 значений, то его медиана равна третьему члену вариационного ряда, если в ряду четное количество членов, то медиана представляет собой среднее арифметическое двух его центральных наблюдений, т.е. если в ряду 10 наблюдений, то медиана равна среднему арифметическому 5 и 6 наблюдения. В нашем примере.

Заметим важную особенность моды и медианы: на их величины не оказывают влияние числовые значения крайних вариант.

Средняя арифметическая величина рассчитывается по формуле:

где - наблюденная величина в -том наблюдении, а - число наблюдений. Для нашего случая.

Средняя арифметическая величина обладает тремя свойствами:

Средняя занимает серединное положение в вариационном ряду. В строго симметричном ряду.

Средняя является обобщающей величиной и за средней не видны случайные колебания, различия в индивидуальных данных. Она отражает то типичное, что характерно для всей совокупности.

Сумма отклонений всех вариант от средней равна нулю: . Отклонение вариант от средней обозначается.

Вариационный ряд состоит из вариант и соответствующих им частот. Из десяти полученных значений цифра 120 встретилась 6 раз, 115 - 3 раза, 125 - 1 раз. Частота () - абсолютная численность отдельных вариант в совокупности, указывающая, сколько раз встречается данная варианта в вариационном ряду.

Вариационный ряд может быть простым (частоты = 1) или сгруппированным укороченным, по 3-5 вариант. Простой ряд используется при малом числе наблюдений (), сгруппированный - при большом числе наблюдений ().