РАСЧЕТ ПОКАЗАТЕЛЕЙ ВАРИАЦИИ

ПРАКТИЧЕСКАЯ РАБОТА 3

Цель работы : получение практических навыков в расчете различных показателей (меры) вариации в зависимости от поставленных исследованием задач.

Порядок выполнения работы :

1. Определить вид и форму (простая или взвешенная) показателей вариации.

3. Сформулировать выводы.

1. Определение вида и формы показателей вариации.

Показатели вариации делятся на две группы: абсолютные и относительные. К абсолютным относятся: размах вариации, квартильное отклонение, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение. Относительными показателями являются коэффициенты осцилляции, вариации, относительное линейное отклонение, относительный показатель квартильной вариации и т. д.

Размах вариации (R) является наиболее простым измерителем вариации признака и определяется по следующей формуле:

где – наибольшее значение варьирующего признака;

– наименьшее значение варьирующего признака.

Квартильное отклонение (Q) – применяется для характеристики вариации признака в совокупности. Может использоваться вместо размаха вариации во избежание недостатков, связанных с использованием крайних значений.

где и – соответственно первая и третья квартили распределения.

Квартили – это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине ; 25% единиц будут заключены между и ; 25% единиц будут заключены между и , и остальные 25% превосходят .

Квартили 1 и 3 определяются по формулам:

,

Где – нижняя граница интервала, в котором находится первая квартиль;

– сумма накопленных частот интервалов, предшествующих интервалу, в котором находится первая квартиль;

– частота интервала, в котором находится первая квартиль.

где Ме – медиана ряда;

,

условные обозначения те же, что и для величин .

В симметричных или умеренно асимметричных распределениях Q»2/3s. Так как на квартильное отклонение не влияют отклонения всех значений признака, то его использование следует ограничить случаями, когда определение среднего квадратического отклонения затруднительно или невозможно.

Среднее линейное отклонение () представляет собой среднюю величину из абсолютных отклонений вариантов признака от их средней. Его можно рассчитать по формуле средней арифметической, как невзвешенной, так и взвешенной, в зависимости от отсутствия или наличия частот в ряду распределения.



Невзвешенное среднее линейное отклонение,

- взвешенное среднее линейное отклонение.

Дисперсия () – средний квадрат отклонений индивидуальных значений признака от их средней величины. Дисперсия вычисляется по формулам простой невзвешенной и взвешенной.

- невзвешенная,

- взвешенная.

Среднее квадратическое отклонение (s) – наиболее распространенный показатель вариации, представляет собой квадратный корень из значения дисперсии.

Размах вариации, квартильное отклонение, среднее линейное и квадратическое отклонения – величины именованные, имеют размерность осредняемого признака. Дисперсия единицы измерения не имеет.

Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Базой для сравнения служит средняя арифметическая. Чаще всего относительные показатели выражаются в процентах и характеризуют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности.

Коэффициент осцилляции (относительный размах вариации) рассчитывается по формуле:

,

Линейный коэффициент вариации (относительное линейное отклонение):

Относительный показатель квартильной вариации :

или

Коэффициент вариации :

,

Наиболее часто применяемый в статистике показатель относительной колеблемости – коэффициент вариации. Его используют не только для сравнительной оценки вариации, но и как характеристику однородности совокупности. Чем больше величина коэффициента вариации, тем больше разброс значений признака вокруг средней, тем больше неоднородность совокупности. Существует шкала определения степени однородности совокупности в зависимости от значений коэффициента вариации (17; С.61).

Для получения приблизительного представления о форме распределения строят графики распределения (полигон и гистограмму).

В практике статистического исследования приходится встречаться с самыми различными распределениями. При изучении однородных совокупностей имеем дело, как правило, с одновершинными распределениями. Многовершинность свидетельствует о неоднородности изучаемой совокупности, появление двух и более вершин говорит о необходимости перегруппировки данных с целью выделения более однородных групп. Выяснение общего характера распределения предполагает оценку степени его однородности, а также вычисление показателей асимметрии и эксцесса. Симметричным является распределение, в котором частоты любых двух вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой. Для симметричных распределений средняя арифметическая, мода и медиана равны между собой. В связи с этим простейший показатель асимметрии основан на соотношении показателей центра распределения: чем больше разница между средними , тем больше асимметрия ряда.

Для характеристики асимметричности в центральной части распределения, то есть основной массы единиц или для сравнительного анализа степени асимметрии нескольких распределений рассчитывают относительный показатель асимметрии К.Пирсона:

Величина показателя As может быть положительной и отрицательной. Положительная величина показателя указывает на наличие правосторонней асимметрии (правая ветвь относительно максимальной ординаты вытянута больше, чем левая). При правосторонней асимметрии между показателями центра распределения существует соотношение: . Отрицательный знак показателя асимметрии свидетельствует о наличии левосторонней асимметрии (рис. 1). Между показателями центра распределения в этом случае имеется соотношение: .



Рис. 1. Распределение:

1 – с левосторонней асимметрией; 2 – с правосторонней асимметрией.

Другой показатель, предложенный шведским математиком Линдбергом, рассчитывают по формуле:

где П – процент тех значений признака, которые превосходят по величине среднюю арифметическую.

Наиболее точным и распространенным является показатель, основанный на определении центрального момента третьего порядка (в симметричном распределении его величина равна нулю):

где - центральный момент третьего порядка:

σ – среднеквадратическое отклонение.

Применение этого показателя дает возможность не только определить величину асимметрии, но и ответить на вопрос о наличии или отсутствии асимметрии в распределении признака в генеральной совокупности. Оценка степени существенности этого показателя дается с помощью средней квадратической ошибки, которая зависит от объема наблюдений n и рассчитывается по формуле:

.

Если отношение , асимметрия существенна, и распределение признака в генеральной совокупности не является симметричным. Если отношение , асимметрия несущественна, ее наличие может быть объяснено влиянием различных случайных обстоятельств.

Для симметричных распределений рассчитывается показатель эксцесса (островершинности). Линдбергом предложен следующий показатель для оценки эксцесса:

,

где П – доля (%) количества вариантов, лежащих в интервале, равном половине среднего квадратического отклонения в ту или другую сторону от средней арифметической.

Наиболее точным является показатель, использующий центральный момент четвертого порядка:

где - центральный момент четвертого момента;

- для несгруппированных данных;

- для сгруппированных данных.

На рисунке 2 представлены два распределения: одно – островершинное (величина эксцесса положительная), второе – плосковершинное (величина эксцесса отрицательная). Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. В нормальном распределении отношение .



Рис. 2. Распределение:

1,4 – нормальное; 2 – островершинное; 3 – плосковершинное

Средняя квадратическая ошибка эксцесса рассчитывается по формуле:

,

где n – число наблюдений.

Если , то эксцесс существенен, если , то несущественен.

Оценка существенности показателей асимметрии и эксцесса позволяет сделать вывод о том, можно ли отнести данное эмпирическое исследование к типу кривых нормального распределения.

2. Рассмотрим методику исчисления показателей вариации.

Вариация признака определяется различными факторами, часть этих факторов можно выделить, если статистическую совокупность разделить на группы по определенному признаку. Тогда, наряду с изучением вариации признака по совокупности в целом, можно изучить вариацию для каждой из составляющих ее группы и между этими группами. В простом случае, когда совокупность разделена на группы по одному фактору, изучение вариации достигается посредством вычисления и анализа трех видов дисперсий: общей, межгрупповой и внутригрупповой.

Эмпирический коэффициент детерминации

Эмпирический коэффициент детерминации широко применяется в статистическом анализе и является показателем, представляющим долю межгруппопой дисперсии в результативного признака и характеризует силу влияния группировочного признака на образование общей вариации. Он может быть рассчитан по формуле:

Показывает долю вариации результативного признака у под влиянием факторного признака х, он связан с коэффициентом корреляции квадратичной зависимостью. При отсутствии связи эмпирический коэффициент детерминации равен нулю, а при функциональной связи - единице.

Например, когда изучается зависимость производительности труда рабочих от их квалификации коэффициент детерминации равен 0,7, то на 70% вариация производительности труда рабочих обусловлена различиями в их квалификации и на 30% - влиянием прочих факторов.

Эмпирическое корреляционное отношение - это квадратный корень из коэффициента детерминации. Отношение показывает тесноту связи между группировочным и результативным признаками. Эмпирическое корреляционное отношение принимает значения от -1 до 1. Если связи нет, то корреляционное отношение равняется нулю, т.е. все групповые средние равняются между собой и межгрупповой вариации нет. Значит, группировочный признак не влияет на образование общей вариации.

Если связь функциональная, то корреляционное отношение равняется единице. В таком случае дисперсия групповых средних равна общей дисперсии, т.е. внутригрупповой вариации нет. Это значит, что группировочный признак полностью определяет вариацию результативного признака.

Чем ближе значение корреляционного отношения к единице, тем сильнее и ближе к функциональной зависимости связь между признаками. Для качественной оценки силы связи на основе показателя эмпирического коэффициента корреляции можно использовать соотношение Чэддока.

Соотношение Чэддока

  • Связь весьма тесная — коэффициент корреляции находится в интервале 0,9 — 0,99
  • Связь тесная — Rxy = 0,7 — 0,9
  • Связь заметная — Rxy = 0,5 — 0,7
  • Связь умеренная — Rxy = 0,3 — 0,5
  • Связь слабая — Rxy = 0,1 — 0,3

представляет собой отношение среднего квадратического отклонения к среднему ожидаемому значению и показывает степень отклонения получаемых результатов.
V = -* 100%, Х
гдеV - коэффициент вариации, %;
G- среднее квадратическое отклонение;
X - среднее ожидаемое значение.
Так как коэффициент вариации - величина относительная, то на его размер не оказывают влияние абсолютные значения изучаемого показателя. С помощью коэффициента вариации можно сравнивать даже колебле-
мость признаков, выраженных в разных единицах измерения. Коэффициент вариации изменяется в пределах от 0 до 100%, при этом, значение коэффициента прямо пропорционально силе колеблемости. Установлена следующая качественная оценка различных коэффициентов вариации:
до 10% - слабая колеблемость;
10-25% - умеренная колеблемость;
свыше 25% - высокая колеблемость.
В качестве варианта может быть использован несколько упрощенный метод определения степени риска. Так как количественно риск характеризуется оценкой вероятной величины максимального и минимального результатов, то «чем больше диапазон между этими величинами при равной их вероятности, тем выше степень риска»1 . Тогда для расчета дисперсии можно использовать следующую формулу:
&2 = PMAX * (max - XУ + Pmin * (X - Xmin У,
2
гдеа2 - дисперсия;
Pmax - вероятность получения максимального результата;
Xmax - максимальная величина результата;
X - средняя ожидаемая величина результата;
Pmjn - вероятность получения минимального результата;
Xmjn - минимальная величина результата.
Полученные показатели следует учитывать в комплексе, так как использование отдельного критерия оценки риска не может служить основой принятия решения в пользу какой-либо стратегии.
В практике встречаются ситуации, когда отсутствует информация о вероятностях состояний среды, т.е. необходима оценка риска в условиях полной неопределенности - (2). В таких случаях для определения наилучших решений используются следующие критерии: максимакса, Вальда, Сэвиджа, Гурвица. Применение каждого из перечисленных критериев рассмотрим на примере матрицы выигрышей А (1) и матрицы рисков R (2).

Еще по теме Коэффициент вариации:

  1. ВАРИАЦИИ В СТРУКТУРЕ И СТРУКТУРНО-ОБУСЛОВЛЕННЫЕ ВАРИАЦИИ
  2. 1.2.10. Определение. Если существует производная функциив точке, то она называется первой вариацией функционала в точке при данной вариации аргумента, и обозначается:

Одной из ключевых стадий подготовки закупочной документации становится расчет начальной максимальной цены контракта (НМЦК). Законодательно предусмотрено несколько способов, с помощью которых можно производить расчеты. Чаще всего используется метод сопоставимых рыночных цен. При этом итоговая НМЦК должна определяться с учетом коэффициента вариации. Поэтому всем заказчикам необходимо понять, что включает в себя этот показатель и как его правильно определить.

Что такое коэффициент вариации

Размер НМЦК определяется еще на этапе планирования. Эта сумма должна быть отражена в плане и план-графике. Непосредственно перед подготовкой извещения она корректируется с учетом сложившейся на тот момент экономической обстановки. Вопросы, связанные с НМЦК рассматриваются в статье 22 44-ФЗ. Методики ее расчета описаны в Приказе Министерства экономики и развития № 567 от 02 октября 2013 года. В этом же документе приводятся правила определения коэффициента вариации.

Разработано несколько методик выявления НМЦК: нормативная, тарифная, проектно-сметная, затратная. Самым приоритетным считается метод сопоставимых рыночных цен . Именно его рекомендуется использовать при определении стартовой цены. Он предполагает сравнение коммерческих предложений, предоставляемых потенциальными поставщиками по запросу заказчика. Для проведения такого анализа и применяется коэффициент вариации. Он выражается в процентах.

Под коэффициентом вариации понимается мера относительного разброса предлагаемых цен. Он показывает, какую долю занимает средний разброс цен от среднего значения цены. Этот показатель может принимать следующие значения:

  1. Меньше 10%. В таком случае разница в ценах признается незначительной.
  2. От 10% до 20%. Разброс считается средним.
  3. От 20% до 33%. Разница признается значительной, но допустимой.
  4. Свыше 33%. Данные неоднородны. При расчете НМЦК не допускается использовать данные с коэффициентом вариации свыше 33%.

Для определения коэффициента разработана специальная формула. По ней легко подсчитать параметр, подставив соответствующие данные. Упростить себе задачу можно, используя калькуляторы, которые сегодня широко представлены в интернете.

Что делать, если коэффициент завышен

Если при расчете коэффициента вариации получилось значение меньше 33%, то выборка признается однородной. Следовательно, полученное значение можно использовать для определения НМЦК.

Если возникла такая ситуация, что значение коэффициента оказывается выше 33 процентов, тогда потребуется внесение корректировок в используемые данные. Для этого проводится дополнительное исследование рынка. Необходимо собрать коммерческие предложения от большего количества поставщиков и повторить расчет на основе новых данных. Если собрать дополнительные предложения не получается, можно воспользоваться сведениями из ранее заключенных договоров, которые хранятся в реестре контрактов.

В крайней ситуации, когда никак не получается добиться нужного коэффициента вариации можно исключить из выборки неподходящие предложения. Вы также можете попросить поставщика указать в своем предложении нужную вам сумму.

Правила расчета

Методика расчета коэффициента вариации прописана в приказе Минэкономразвития № 567. Согласно действующим нормам заказчик должен направить не менее пяти запросов коммерческих предложений потенциальным поставщикам. Для расчета используются не менее трех предложений, полностью соответствующих требованиям заказчика.

Стоит отметить, что приказ № 567 не является нормативным актом, следовательно, его исполнение не обязательно. За его нарушение никаких штрафных санкций не предусматривается. Однако во избежание спорных ситуаций заказчика рекомендуется пользоваться именно этими правилами расчета.

Для определения коэффициента вариации применяется следующая формула:

Среднеквадратичное отклонение позволяет определить разброс данных. Для его определения выбирают среднюю цену и меру разброса. Вычислить среднеквадратичное отклонение удается по следующей формуле:

В ситуациях, когда закупка включает в себя одновременно несколько позиций, расчет ведется по каждой из них. Это позволяет выявить товары с наибольшим разбросом цен.

Пример расчета

Предположим, что государственное учреждение проводит закупку принтеров для собственных нужд. Потенциальным поставщикам были отправлены соответствующие запросы. Было получено четыре коммерческих предложения цен: 2500 рублей, 2800 рублей, 2450 рублей и 2600 рублей.

Следующим шагом становится расчет среднеквадратичного отклонения

Рейтинг 4.87 (15 Голосов)

В этом же документе приводятся правила определения коэффициента вариации. Разработано несколько методик выявления НМЦК: нормативная, тарифная, проектно-сметная, затратная. Самым приоритетным считается метод сопоставимых рыночных цен. Именно его рекомендуется использовать при определении стартовой цены. Он предполагает сравнение коммерческих предложений, предоставляемых потенциальными поставщиками по запросу заказчика. Для проведения такого анализа и применяется коэффициент вариации. Он выражается в процентах. Под коэффициентом вариации понимается мера относительного разброса предлагаемых цен. Он показывает, какую долю занимает средний разброс цен от среднего значения цены. Этот показатель может принимать следующие значения:

  1. Меньше 10%. В таком случае разница в ценах признается незначительной.
  2. От 10% до 20%. Разброс считается средним.
  3. От 20% до 33%.

Коэффициент вариации

Для проверки соответствия исследуемых значений закону нормального распределения применяют отношение показателя асимметрии к его ошибке и отношение показателя эксцесса к его ошибке. Показатель асимметрии Показатель асимметрии (A) и его ошибка (ma) рассчитывается по следующим формулам: , где А — показатель асимметрии, — среднеквадратическое отклонение,a — среднее арифметическое,n — число измерений параметра,ai — измеренное значение на i-м шаге.


Показатель эксцесса Показатель эксцесса (E) и его ошибка (me) рассчитывается по следующим формулам: , где Е — показатель эксцесса, — среднеквадратическое отклонение,a — среднее арифметическое,n — число измерений параметра,ai — измеренное значение на i-м шаге. Если А < 0, то больше данных с меньшими значениями, чем среднеарифметическое.
Если Е < 0, то данные сконцентрированы около среднеарифметического значения.

Инфо

X – отдельные значения, X̅– среднее арифметическое по выборке. Примечание. Для расчета дисперсии в Excel предусмотрена специальная функция.


Стоит отметить, что у такого расчета дисперсии есть недостаток – она получается смещенной, т.е. ее математическое ожидание не равно истинному значению дисперсии. Подробней об этом здесь. В то же время не все так плохо.
При увеличении объема выборки она все-таки приближается к своему теоретическому аналогу, т.е. является асимптотически не смещенной. Поэтому при работе с большими размерами выборок можно использовать формулу выше.
Язык знаков полезно перевести на язык слов. Получится, что дисперсия — это средний квадрат отклонений. То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат, складывается и затем делится на количество значений в данной совокупности.

Что характеризует коэффициент вариации

Для определения дисперсии нормального закона распределения ошибок в этом случае пользуются формулой: , где 2 — дисперсия,a — среднее арифметическое,n — число измерений параметра,ai — измеренное значение на i-м шаге. Среднеквадратическое отклонение Среднеквадратическое отклонение показывает абсолютное отклонение измеренных значений от среднеарифметического.
В соответствии с формулой для меры точности линейной комбинации средняя квадратическая ошибка среднего арифметического определяется по формуле: , где — среднеквадратическое отклонение,a — среднее арифметическое,n — число измерений параметра,ai — измеренное значение на i-м шаге. Коэффициент вариации Коэффициент вариации характеризует относительную меру отклонения измеренных значений от среднеарифметического: , где V — коэффициент вариации, — среднеквадратическое отклонение,a — среднее арифметическое.

Вариация (статистика)

Для полноты описания нужно понять, какой является разница между средним ростом каждого студента и средним значением. На первом этапе вычислим параметр дисперсии. Дисперсия в статистике (обозначается σ2 (сигма в квадрате)) – это отношение суммы квадратов разности среднего арифметического (μ) и значения члена ряда (Х) к числу всех членов совокупности (N).

В виде формулы это рассчитывается понятнее: Значения, которые мы получим в результате вычислений по этой формуле, мы будем представлять в виде квадрата величины (в нашем случае – квадратные сантиметры). Характеризовать рост в сантиметрах квадратными сантиметрами, согласитесь, нелепо. Поэтому мы можем исправить, точнее, упростить это выражение и получим среднеквадратичное отклонение формулу и расчёт, пример: Таким образом, мы получили величину стандартного отклонения (или среднего квадратичного отклонения) – квадратный корень из дисперсии.

Коэффициент вариации в статистике: примеры расчета

Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, мы просто рассчитываем среднюю арифметическую. Средний – квадрат – отклонений. Отклонения возводятся в квадрат, и считается средняя.

Внимание

Разгадка заключается всего в трех словах. Однако в чистом виде, как, например, средняя арифметическая, или индекс, дисперсия не используется. Это скорее вспомогательный и промежуточный показатель, который необходим для других видов статистического анализа.


У нее даже единицы измерения нормальной нет. Судя по формуле, это квадрат единицы измерения исходных данных. Без бутылки, как говорится, не разберешься.

Статистические параметры

Было получено четыре коммерческих предложения цен: 2500 рублей, 2800 рублей, 2450 рублей и 2600 рублей. В первую очередь необходимо рассчитать среднеарифметическое значение цены Следующим шагом становится расчет среднеквадратичного отклонения Осталось только рассчитать коэффициент вариации Полученное значение коэффициента меньше 33%, следовательно, все собранные данные подходят для расчета стартовой цены контракта. Расчет НМЦК и коэффициента вариации оформляются в форме отчета, который становится обязательной частью закупочной документации. Коэффициент вариации – важный инструмент, позволяющий оценить правильность ценовых предложений, полученных от поставщиков. Поэтому при составлении документации заказчикам необходимо учитывать правила расчета этого показателя и особенности его применения.

Для чего нужен коэффициент вариации

Как доказать, что закономерность, полученная при изучении экспериментальных данных, не является результатом совпадения или ошибки экспериментатора, что она достоверна? С таким вопросом сталкиваются начинающие исследователи.Описательная статистика предоставляет инструменты для решения этих задач. Она имеет два больших раздела – описание данных и их сопоставление в группах или в ряду между собой. Оглавление:

  • Показатели описательной статистики
  • Среднее арифметическое
  • Стандартное отклонение
  • Коэффициент вариации
  • Расчёты в Microsoft Ecxel 2016