Как посчитать коэффициент вариации в excel
Перейти к содержимому

Как посчитать коэффициент вариации в excel

  • автор:

Как рассчитать коэффициент вариации в Excel

Как рассчитать коэффициент вариации в Excel

Коэффициент вариации , часто обозначаемый как CV, представляет собой способ измерения степени разброса значений в наборе данных по отношению к среднему значению. Он рассчитывается как:

CV = σ / μ

σ = стандартное отклонение набора данных

μ = среднее значение набора данных

Проще говоря, коэффициент вариации — это просто отношение между стандартным отклонением и средним значением.

Когда используется коэффициент вариации?

Коэффициент вариации часто используется для сравнения вариации между двумя разными наборами данных.

В реальном мире он часто используется в финансах для сравнения среднего ожидаемого дохода от инвестиций с ожидаемым стандартным отклонением инвестиций. Это позволяет инвесторам сравнивать соотношение риска и доходности между инвестициями.

Например, предположим, что инвестор рассматривает возможность инвестирования в следующие два взаимных фонда:

Взаимный фонд A: среднее = 7%, стандартное отклонение = 12,4%

Взаимный фонд B: среднее = 5%, стандартное отклонение = 8,2%

При расчете коэффициента вариации для каждого фонда инвестор находит:

CV для взаимного фонда A = 12,4% / 7% = 1,77

CV для взаимного фонда B = 8,2% / 5% = 1,64

Поскольку взаимный фонд B имеет более низкий коэффициент вариации, он предлагает лучшую среднюю доходность по сравнению со стандартным отклонением.

Как рассчитать коэффициент вариации в Excel

В Excel нет встроенной формулы для расчета коэффициента вариации для набора данных, но, к счастью, его относительно легко вычислить, используя пару простых формул. В следующем примере показано, как рассчитать коэффициент вариации для заданного набора данных.

Предположим, у нас есть следующий набор данных, содержащий экзаменационные оценки 20 студентов:

Пример набора данных в Excel

Чтобы рассчитать коэффициент вариации для этого набора данных, нам нужно знать только два числа: среднее значение и стандартное отклонение. Их можно рассчитать по следующим формулам:

Среднее значение: =СРЕДНЕЕ(A2:A21)

Стандартное отклонение: =СТАНДОТКЛОН(A2:A21)

Расчет коэффициента вариации для набора данных в Excel

Чтобы вычислить коэффициент вариации, мы затем делим стандартное отклонение на среднее значение:

Коэффициент вариации в Excel

Коэффициент вариации оказывается равным 0,0864 .

Обратите внимание, что мы также могли бы использовать только одну формулу для расчета CV:

Дисперсия, среднеквадратичное (стандартное) отклонение, коэффициент вариации в Excel

Из предыдущей статьи мы узнали о таких показателях, как размах вариации, межквартильный размах и среднее линейное отклонение. В этой статье изучим дисперсию, среднеквадратичное отклонение и коэффициент вариации.

Дисперсия

Дисперсия случайной величины – это один из основных показателей в статистике. Он отражает меру разброса данных вокруг средней арифметической.

Сейчас небольшой экскурс в теорию вероятностей, которая лежит в основе математической статистики. Как и матожидание, дисперсия является важной характеристикой случайной величины. Если матожидание отражает центр случайной величины, то дисперсия дает характеристику разброса данных вокруг центра.

Формула дисперсии в теории вероятностей имеет вид:

Формула дисперсии в теории вероятностей

То есть дисперсия — это математическое ожидание отклонений от математического ожидания.

На практике при анализе выборок математическое ожидание, как правило, не известно. Поэтому вместо него используют оценку – среднее арифметическое. Расчет дисперсии производят по формуле:

Дисперсия во выборке

s 2 – выборочная дисперсия, рассчитанная по данным наблюдений,

X – отдельные значения,

– среднее арифметическое по выборке.

Стоит отметить, что у такого расчета дисперсии есть недостаток – она получается смещенной, т.е. ее математическое ожидание не равно истинному значению дисперсии. Подробней об этом здесь. Однако при увеличении объема выборки она все-таки приближается к своему теоретическому аналогу, т.е. является асимптотически не смещенной.

Простыми словами дисперсия – это средний квадрат отклонений. То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат, складывается и затем делится на количество значений в данной совокупности. Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, просто рассчитываем среднюю арифметическую. Средний – квадрат – отклонений. Отклонения возводятся в квадрат, и считается средняя. Теперь вы знаете, как найти дисперсию.

Расчет дисперсии в Excel

Генеральную и выборочную дисперсии легко рассчитать в Excel. Есть специальные функции: ДИСП.Г и ДИСП.В соответственно.

Функции Excel для расчета дисперсии

В чистом виде дисперсия не используется. Это вспомогательный показатель, который нужен в других расчетах. Например, в проверке статистических гипотез или расчете коэффициентов корреляции. Отсюда неплохо бы знать математические свойства дисперсии.

Свойства дисперсии

Свойство 1. Дисперсия постоянной величины A равна 0 (нулю).

Свойство 2. Если случайную величину умножить на постоянную А, то дисперсия этой случайной величины увеличится в А 2 раз. Другими словами, постоянный множитель можно вынести за знак дисперсии, возведя его в квадрат.

Свойство 3. Если к случайной величине добавить (или отнять) постоянную А, то дисперсия останется неизменной.

Свойство 4. Если случайные величины X и Y независимы, то дисперсия их суммы равна сумме их дисперсий.

Свойство 5. Если случайные величины X и Y независимы, то дисперсия их разницы также равна сумме дисперсий.

Среднеквадратичное (стандартное) отклонение

Если из дисперсии извлечь квадратный корень, получится среднеквадратичное (стандартное) отклонение (сокращенно СКО). Встречается название среднее квадратичное отклонение и сигма (от названия греческой буквы). Общая формула стандартного отклонения в математике следующая:

Среднеквадратичное отклонение

На практике формула стандартного отклонения следующая:

Среднеквадратичное отклонение по генеральной совокупности

Как и с дисперсией, есть и немного другой вариант расчета. Но с ростом выборки разница исчезает.

Расчет cреднеквадратичного (стандартного) отклонения в Excel

Для расчета стандартного отклонения достаточно из дисперсии извлечь квадратный корень. Но в Excel есть и готовые функции: СТАНДОТКЛОН.Г и СТАНДОТКЛОН.В (по генеральной и выборочной совокупности соответственно).

Среднеквадратичное (стандартное) отклонение в Excel

Среднеквадратичное отклонение имеет те же единицы измерения, что и анализируемый показатель, поэтому является сопоставимым с исходными данными.

Коэффициент вариации

Значение стандартного отклонения зависит от масштаба самих данных, что не позволяет сравнивать вариабельность разных выборках. Чтобы устранить влияние масштаба, необходимо рассчитать коэффициент вариации по формуле:

Формула коэффициента вариации

По нему можно сравнивать однородность явлений даже с разным масштабом данных. В статистике принято, что, если значение коэффициента вариации менее 33%, то совокупность считается однородной, если больше 33%, то – неоднородной. В реальности, если коэффициент вариации превышает 33%, то специально ничего делать по этому поводу не нужно. Это информация для общего представления. В общем коэффициент вариации используют для оценки относительного разброса данных в выборке.

Расчет коэффициента вариации в Excel

Расчет коэффициента вариации в Excel также производится делением стандартного отклонения на среднее арифметическое:

Коэффициент вариации обычно выражается в процентах, поэтому ячейке с формулой можно присвоить процентный формат:

Процентный формат

Коэффициент осцилляции

Еще один показатель разброса данных на сегодня – коэффициент осцилляции. Это соотношение размаха вариации (разницы между максимальным и минимальным значением) к средней. Готовой формулы Excel нет, поэтому придется скомпоновать три функции: МАКС, МИН, СРЗНАЧ.

Коэффициент осцилляции в Excel

Коэффициент осцилляции показывает степень размаха вариации относительно средней, что также можно использовать для сравнения различных наборов данных.

Таким образом, в статистическом анализе существует система показателей, отражающих разброс или однородность данных.

Ниже видео о том, как посчитать коэффициент вариации, дисперсию, стандартное (среднеквадратичное) отклонение и другие показатели вариации в Excel.

Как в Excel посчитать квадратичное отклонение и коэффициент вариации?

Как в Excel посчитать квадратичное отклонение и коэффициент вариации? Формула для подсчета квадратичного отклонения и коэффициента вариации?

Кроме выведения начальной максимальной цены частенько возникает необходимость подсчитать коэффициент вариации. Необходимо это для того, чтобы иметь представление о величине разброса сумм между ценами разных поставщиков и средней арифметической суммой. Для того, чтобы вычислить коэффициент вариации необходимо подсчитать квадратичное отклонение. Пример: у нас есть три источника цены. Цена №1 — это ячейка Е 15, цена № 2 — это ячейка F 15, цена № 3 — это ячейка G 15. Для начала выведем среднее арифметическое. Для этого нам необходимо сложить три суммы (Е 15 + F 15 + G 15)/3 и разделить на три (ведь у нас три источника цены). Обозначим полученную цифру номером J 15. Теперь выводим квадратичное отклонение по формуле: =КОРЕНЬ(((E15-J15)^2+(F15-J15)^2+(G15-J15)^2)/(3-1)). Так как у нас три источника цены, то в конце формулы указаны цифры 3-1. Если бы источника было бы больше 4 или 5, то соответственно получили бы 4-1 или 5-1. Полученная в результате вычисления по формуле цифра и будет квадратичным отклонением. Обозначим ее номером Н 15. Теперь остается вычислить коэффициент вариации. Для этого достаточно Н15/(разделить на) J 15 и умножить цифру на 100. Получим коэффициент вариации. В Exel не обязательно умножать на 100. Можно просто перевести формат ячейки в процентный формат.

XYZ анализ — коэффициент вариации — подготовка данных к прогнозу

xyz анализ и коэффициент вариации расчет в Excel

Коэффициент вариации — это показатель, отражающий разброс значений относительно среднего (отношение стандартного отклонения к среднему значению). Коэффициент вариации измеряется в процентах и отражает однородность временного ряда.

Коэффициент вариации — это отличный показатель, который поможет вам в подготовке данных для прогноза. Коэффициент вариации — индикатор, который поможет вам выделить ряды, на которые стоит обратить внимание перед расчетом прогноза и очистить данные от случайных факторов.

Если коэффициент равен 0%, то ряд абсолютно однородный, т.е. все значения между собой равны.

Если коэффициент вариации больше 33%, то по классической теории ряд считается неоднородным, т.е. большой разброс данных относительно среднего значения.

Как рассчитать коэффициент вариации в Excel

Коэффициент вариации = отношение стандартного отклонения к среднему

В Excel коэффициент вариации можно рассчитать с помощью следующей формулы:

=СТАНДОТКЛОНПА(ссылка на ряд)/(СУММ(ссылка на ряд)/СЧЁТЕСЛИ(ссылка на ряд;»>0″))

  • СТАНДОТКЛОНПА(J6:M6) — формула для расчета значения стандартного отклонения в Excel за анализируемый период;
  • (СУММ(J6:M6)/СЧЁТЕСЛИ(J6:M6;»>0″)) — среднее за анализируемый период;

Вводим формулу в ячейку, получаем расчет коэффициента вариации

Коэффициент вариации

Протягиваем формулу на весь массив данных.

Как сделать XYZ анализ?

Теперь сегментируем наши коэффициенты вариации и присваиваем каждому одну из 3-х букв X Y и Z

  • X — для рядов с коэффициентом вариации от 0% до 10%
  • Y — для рядов с коэффициентом вариации от 10% до 25%
  • Z — для рядов с коэффициентом вариации от 25% и больше

Вводим в ячейку Excel формулу

N3 — ссылка на коэффициент вариации

XYZ анализ

Применение XYZ анализа при подготовке данных к прогнозу

Работая с большим массивом данных при подготовке данных к прогнозу, необходим индикатор, который будет подсказывать, на какие временные ряды в первую очередь стоит обратить внимание. В качестве индикатора вы можете использовать «коэффициент вариации» или XYZ анализ.

Если коэффициент вариации больше 10 — 25% или для Y и Z рядов, то изучаем данные (например, продажи товара по месяцам в разрезе направлений продаж) и определяем факторы, повлиявшие на отклонение.

Добавляем фильтр на столбец XYZ анализ и анализируем ряды.

Сначала отфильтруем ряды с коэффициентом вариации больше 25% или Z

XYZ анализ и коэффициент вариации

Изучаем ряды с большими отклонениями фактических данных за последние 4-5 месяцев. Определяем причины провалов или резких подъёмов продаж. Готовим данные для прогноза. Очищаем данные от влияния случайных факторов или корректируем дефицит.

Также, если в ряду большая неоднородность, то имеет смысл группировать временной ряд. Например,

  • Неоднородные продажи по месяцам свернуть до продаж по кварталам,
  • Продажи по неделям свернуть до продаж по месяцам,
  • Продажи по товарам свернуть до товарных групп.

Сделать прогноз по однородной группе более высокого уровня, а затем распределить пропорционально логики внутри группы.

О том, как сгруппировать временной ряд, читайте статью «Как сделать сводную и сгруппировать временные ряды?»

Затем выделяем ряды с коэффициентом вариации Y

XYZ подготовка данных к прогнозу

Аналогично просматриваем каждый ряд, и в случае, если замечаете нестандартное поведение ряда, выявляете причины и в случае необходимости очищаете данные.

Рекомендуем создать список факторов (например, акции по стимулированию сбыта, отсутствие товара на складе, спец клиенты. ), и для каждого из факторов определить показатель, который вычитаем или прибавляем к данным для прогноза.

После того, как данные очищены от факторов, которые в будущем не повторятся и подготовлены для прогноза, мы рассчитываем прогноз продаж.

Теперь при расчете прогноза на большом количестве временных рядов, вы можете придерживаться следующей схемы:

  1. Рассчитываем коэффициент вариации;
  2. Делаем XYZ анализ;
  3. Готовим данные для прогноза (очищаем от случайных факторов или группируем временные ряды);
  4. Строим прогноз;
  5. Учитываем дополнительные факторы в прогнозе;

Точных вам прогнозов!

Присоединяйтесь к нам!

Скачивайте бесплатные приложения для прогнозирования и бизнес-анализа:

Novo Forecast - прогноз в Excel - точно, легко и быстро!

  • Novo Forecast Lite — автоматический расчет прогноза в Excel .
  • 4analytics — ABC-XYZ-анализ и анализ выбросов в Excel.
  • Qlik Sense Desktop и QlikView Personal Edition — BI-системы для анализа и визуализации данных.

Тестируйте возможности платных решений:

  • Novo Forecast PRO — прогнозирование в Excel для больших массивов данных.

Получите 10 рекомендаций по повышению точности прогнозов до 90% и выше.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *