Как рассчитать коэффициент вариации в Excel
Коэффициент вариации , часто обозначаемый как CV, представляет собой способ измерения степени разброса значений в наборе данных по отношению к среднему значению. Он рассчитывается как:
CV = σ / μ
σ = стандартное отклонение набора данных
μ = среднее значение набора данных
Проще говоря, коэффициент вариации — это просто отношение между стандартным отклонением и средним значением.
Когда используется коэффициент вариации?
Коэффициент вариации часто используется для сравнения вариации между двумя разными наборами данных.
В реальном мире он часто используется в финансах для сравнения среднего ожидаемого дохода от инвестиций с ожидаемым стандартным отклонением инвестиций. Это позволяет инвесторам сравнивать соотношение риска и доходности между инвестициями.
Например, предположим, что инвестор рассматривает возможность инвестирования в следующие два взаимных фонда:
Взаимный фонд A: среднее = 7%, стандартное отклонение = 12,4%
Взаимный фонд B: среднее = 5%, стандартное отклонение = 8,2%
При расчете коэффициента вариации для каждого фонда инвестор находит:
CV для взаимного фонда A = 12,4% / 7% = 1,77
CV для взаимного фонда B = 8,2% / 5% = 1,64
Поскольку взаимный фонд B имеет более низкий коэффициент вариации, он предлагает лучшую среднюю доходность по сравнению со стандартным отклонением.
Как рассчитать коэффициент вариации в Excel
В Excel нет встроенной формулы для расчета коэффициента вариации для набора данных, но, к счастью, его относительно легко вычислить, используя пару простых формул. В следующем примере показано, как рассчитать коэффициент вариации для заданного набора данных.
Предположим, у нас есть следующий набор данных, содержащий экзаменационные оценки 20 студентов:
Чтобы рассчитать коэффициент вариации для этого набора данных, нам нужно знать только два числа: среднее значение и стандартное отклонение. Их можно рассчитать по следующим формулам:
Среднее значение: =СРЕДНЕЕ(A2:A21)
Стандартное отклонение: =СТАНДОТКЛОН(A2:A21)
Чтобы вычислить коэффициент вариации, мы затем делим стандартное отклонение на среднее значение:
Коэффициент вариации оказывается равным 0,0864 .
Обратите внимание, что мы также могли бы использовать только одну формулу для расчета CV:
Дисперсия, среднеквадратичное (стандартное) отклонение, коэффициент вариации в Excel
Из предыдущей статьи мы узнали о таких показателях, как размах вариации, межквартильный размах и среднее линейное отклонение. В этой статье изучим дисперсию, среднеквадратичное отклонение и коэффициент вариации.
Дисперсия
Дисперсия случайной величины – это один из основных показателей в статистике. Он отражает меру разброса данных вокруг средней арифметической.
Сейчас небольшой экскурс в теорию вероятностей, которая лежит в основе математической статистики. Как и матожидание, дисперсия является важной характеристикой случайной величины. Если матожидание отражает центр случайной величины, то дисперсия дает характеристику разброса данных вокруг центра.
Формула дисперсии в теории вероятностей имеет вид:
То есть дисперсия — это математическое ожидание отклонений от математического ожидания.
На практике при анализе выборок математическое ожидание, как правило, не известно. Поэтому вместо него используют оценку – среднее арифметическое. Расчет дисперсии производят по формуле:
s 2 – выборочная дисперсия, рассчитанная по данным наблюдений,
X – отдельные значения,
X̅– среднее арифметическое по выборке.
Стоит отметить, что у такого расчета дисперсии есть недостаток – она получается смещенной, т.е. ее математическое ожидание не равно истинному значению дисперсии. Подробней об этом здесь. Однако при увеличении объема выборки она все-таки приближается к своему теоретическому аналогу, т.е. является асимптотически не смещенной.
Простыми словами дисперсия – это средний квадрат отклонений. То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат, складывается и затем делится на количество значений в данной совокупности. Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, просто рассчитываем среднюю арифметическую. Средний – квадрат – отклонений. Отклонения возводятся в квадрат, и считается средняя. Теперь вы знаете, как найти дисперсию.
Расчет дисперсии в Excel
Генеральную и выборочную дисперсии легко рассчитать в Excel. Есть специальные функции: ДИСП.Г и ДИСП.В соответственно.
В чистом виде дисперсия не используется. Это вспомогательный показатель, который нужен в других расчетах. Например, в проверке статистических гипотез или расчете коэффициентов корреляции. Отсюда неплохо бы знать математические свойства дисперсии.
Свойства дисперсии
Свойство 1. Дисперсия постоянной величины A равна 0 (нулю).
Свойство 2. Если случайную величину умножить на постоянную А, то дисперсия этой случайной величины увеличится в А 2 раз. Другими словами, постоянный множитель можно вынести за знак дисперсии, возведя его в квадрат.
Свойство 3. Если к случайной величине добавить (или отнять) постоянную А, то дисперсия останется неизменной.
Свойство 4. Если случайные величины X и Y независимы, то дисперсия их суммы равна сумме их дисперсий.
Свойство 5. Если случайные величины X и Y независимы, то дисперсия их разницы также равна сумме дисперсий.
Среднеквадратичное (стандартное) отклонение
Если из дисперсии извлечь квадратный корень, получится среднеквадратичное (стандартное) отклонение (сокращенно СКО). Встречается название среднее квадратичное отклонение и сигма (от названия греческой буквы). Общая формула стандартного отклонения в математике следующая:
На практике формула стандартного отклонения следующая:
Как и с дисперсией, есть и немного другой вариант расчета. Но с ростом выборки разница исчезает.
Расчет cреднеквадратичного (стандартного) отклонения в Excel
Для расчета стандартного отклонения достаточно из дисперсии извлечь квадратный корень. Но в Excel есть и готовые функции: СТАНДОТКЛОН.Г и СТАНДОТКЛОН.В (по генеральной и выборочной совокупности соответственно).
Среднеквадратичное отклонение имеет те же единицы измерения, что и анализируемый показатель, поэтому является сопоставимым с исходными данными.
Коэффициент вариации
Значение стандартного отклонения зависит от масштаба самих данных, что не позволяет сравнивать вариабельность разных выборках. Чтобы устранить влияние масштаба, необходимо рассчитать коэффициент вариации по формуле:
По нему можно сравнивать однородность явлений даже с разным масштабом данных. В статистике принято, что, если значение коэффициента вариации менее 33%, то совокупность считается однородной, если больше 33%, то – неоднородной. В реальности, если коэффициент вариации превышает 33%, то специально ничего делать по этому поводу не нужно. Это информация для общего представления. В общем коэффициент вариации используют для оценки относительного разброса данных в выборке.
Расчет коэффициента вариации в Excel
Расчет коэффициента вариации в Excel также производится делением стандартного отклонения на среднее арифметическое:
Коэффициент вариации обычно выражается в процентах, поэтому ячейке с формулой можно присвоить процентный формат:
Коэффициент осцилляции
Еще один показатель разброса данных на сегодня – коэффициент осцилляции. Это соотношение размаха вариации (разницы между максимальным и минимальным значением) к средней. Готовой формулы Excel нет, поэтому придется скомпоновать три функции: МАКС, МИН, СРЗНАЧ.
Коэффициент осцилляции показывает степень размаха вариации относительно средней, что также можно использовать для сравнения различных наборов данных.
Таким образом, в статистическом анализе существует система показателей, отражающих разброс или однородность данных.
Ниже видео о том, как посчитать коэффициент вариации, дисперсию, стандартное (среднеквадратичное) отклонение и другие показатели вариации в Excel.
Как в Excel посчитать квадратичное отклонение и коэффициент вариации?
Как в Excel посчитать квадратичное отклонение и коэффициент вариации? Формула для подсчета квадратичного отклонения и коэффициента вариации?
Кроме выведения начальной максимальной цены частенько возникает необходимость подсчитать коэффициент вариации. Необходимо это для того, чтобы иметь представление о величине разброса сумм между ценами разных поставщиков и средней арифметической суммой. Для того, чтобы вычислить коэффициент вариации необходимо подсчитать квадратичное отклонение. Пример: у нас есть три источника цены. Цена №1 — это ячейка Е 15, цена № 2 — это ячейка F 15, цена № 3 — это ячейка G 15. Для начала выведем среднее арифметическое. Для этого нам необходимо сложить три суммы (Е 15 + F 15 + G 15)/3 и разделить на три (ведь у нас три источника цены). Обозначим полученную цифру номером J 15. Теперь выводим квадратичное отклонение по формуле: =КОРЕНЬ(((E15-J15)^2+(F15-J15)^2+(G15-J15)^2)/(3-1)). Так как у нас три источника цены, то в конце формулы указаны цифры 3-1. Если бы источника было бы больше 4 или 5, то соответственно получили бы 4-1 или 5-1. Полученная в результате вычисления по формуле цифра и будет квадратичным отклонением. Обозначим ее номером Н 15. Теперь остается вычислить коэффициент вариации. Для этого достаточно Н15/(разделить на) J 15 и умножить цифру на 100. Получим коэффициент вариации. В Exel не обязательно умножать на 100. Можно просто перевести формат ячейки в процентный формат.
XYZ анализ — коэффициент вариации — подготовка данных к прогнозу
Коэффициент вариации — это показатель, отражающий разброс значений относительно среднего (отношение стандартного отклонения к среднему значению). Коэффициент вариации измеряется в процентах и отражает однородность временного ряда.
Коэффициент вариации — это отличный показатель, который поможет вам в подготовке данных для прогноза. Коэффициент вариации — индикатор, который поможет вам выделить ряды, на которые стоит обратить внимание перед расчетом прогноза и очистить данные от случайных факторов.
Если коэффициент равен 0%, то ряд абсолютно однородный, т.е. все значения между собой равны.
Если коэффициент вариации больше 33%, то по классической теории ряд считается неоднородным, т.е. большой разброс данных относительно среднего значения.
Как рассчитать коэффициент вариации в Excel
Коэффициент вариации = отношение стандартного отклонения к среднему
В Excel коэффициент вариации можно рассчитать с помощью следующей формулы:
=СТАНДОТКЛОНПА(ссылка на ряд)/(СУММ(ссылка на ряд)/СЧЁТЕСЛИ(ссылка на ряд;»>0″))
- СТАНДОТКЛОНПА(J6:M6) — формула для расчета значения стандартного отклонения в Excel за анализируемый период;
- (СУММ(J6:M6)/СЧЁТЕСЛИ(J6:M6;»>0″)) — среднее за анализируемый период;
Вводим формулу в ячейку, получаем расчет коэффициента вариации
Протягиваем формулу на весь массив данных.
Как сделать XYZ анализ?
Теперь сегментируем наши коэффициенты вариации и присваиваем каждому одну из 3-х букв X Y и Z
- X — для рядов с коэффициентом вариации от 0% до 10%
- Y — для рядов с коэффициентом вариации от 10% до 25%
- Z — для рядов с коэффициентом вариации от 25% и больше
Вводим в ячейку Excel формулу
N3 — ссылка на коэффициент вариации
Применение XYZ анализа при подготовке данных к прогнозу
Работая с большим массивом данных при подготовке данных к прогнозу, необходим индикатор, который будет подсказывать, на какие временные ряды в первую очередь стоит обратить внимание. В качестве индикатора вы можете использовать «коэффициент вариации» или XYZ анализ.
Если коэффициент вариации больше 10 — 25% или для Y и Z рядов, то изучаем данные (например, продажи товара по месяцам в разрезе направлений продаж) и определяем факторы, повлиявшие на отклонение.
Добавляем фильтр на столбец XYZ анализ и анализируем ряды.
Сначала отфильтруем ряды с коэффициентом вариации больше 25% или Z
Изучаем ряды с большими отклонениями фактических данных за последние 4-5 месяцев. Определяем причины провалов или резких подъёмов продаж. Готовим данные для прогноза. Очищаем данные от влияния случайных факторов или корректируем дефицит.
Также, если в ряду большая неоднородность, то имеет смысл группировать временной ряд. Например,
- Неоднородные продажи по месяцам свернуть до продаж по кварталам,
- Продажи по неделям свернуть до продаж по месяцам,
- Продажи по товарам свернуть до товарных групп.
Сделать прогноз по однородной группе более высокого уровня, а затем распределить пропорционально логики внутри группы.
О том, как сгруппировать временной ряд, читайте статью «Как сделать сводную и сгруппировать временные ряды?»
Затем выделяем ряды с коэффициентом вариации Y
Аналогично просматриваем каждый ряд, и в случае, если замечаете нестандартное поведение ряда, выявляете причины и в случае необходимости очищаете данные.
Рекомендуем создать список факторов (например, акции по стимулированию сбыта, отсутствие товара на складе, спец клиенты. ), и для каждого из факторов определить показатель, который вычитаем или прибавляем к данным для прогноза.
После того, как данные очищены от факторов, которые в будущем не повторятся и подготовлены для прогноза, мы рассчитываем прогноз продаж.
Теперь при расчете прогноза на большом количестве временных рядов, вы можете придерживаться следующей схемы:
- Рассчитываем коэффициент вариации;
- Делаем XYZ анализ;
- Готовим данные для прогноза (очищаем от случайных факторов или группируем временные ряды);
- Строим прогноз;
- Учитываем дополнительные факторы в прогнозе;
Точных вам прогнозов!
Присоединяйтесь к нам!
Скачивайте бесплатные приложения для прогнозирования и бизнес-анализа:
- Novo Forecast Lite — автоматический расчет прогноза в Excel .
- 4analytics — ABC-XYZ-анализ и анализ выбросов в Excel.
- Qlik Sense Desktop и QlikView Personal Edition — BI-системы для анализа и визуализации данных.
Тестируйте возможности платных решений:
- Novo Forecast PRO — прогнозирование в Excel для больших массивов данных.
Получите 10 рекомендаций по повышению точности прогнозов до 90% и выше.