В системе статистической обработки данных и аналитики часто используется сочетание методик корреляции и регрессии. Создателем корреляционно-регрессионного анализа считается Фрэнсис Гальтон, который разработал теоретическую основу методологии в 1795 году. В конце 19 века многие европейские ученые в области теории статистики углубили познания в вопросе использования количественных измерителей для отражения связей между явлениями.
Можно ли применять корреляционно-регрессионный анализ в нефтедобывающей промышленности?
Что такое корреляционно-регрессионный анализ (КРА) предприятия?
Корреляционно-регрессионный анализ (КРА) на предприятиях используется для выявления связей между несколькими факторами хозяйственной деятельности и оценки степени взаимозависимости выбранных для анализа критериев. Методика использует два алгоритма действий:
- Корреляция, которая направлена на построение моделей связей.
- Регрессия, используемая для прогнозирования событий на основе наиболее подходящей для ситуации модели связей.
Анализ проводится в несколько шагов:
- постановка задач проведения исследования;
- массовый сбор информации: систематизация статистических данных по конкретным показателям деятельности предприятия в динамике за несколько периодов;
- этап создания модели связей;
- анализ функционирования модели, оценка ее эффективности.
Для проведения КРА необходимо использовать показатели в едином измерителе, все они должны иметь числовое значение.
ОБРАТИТЕ ВНИМАНИЕ! Для достоверности данных и работоспособности модели сведения должны быть собраны за длительный отрезок времени.
Для полноты анализа надо устранить количественные ограничения на показатели модели, должно соблюдаться условие постоянной временной и территориальной структуры рассматриваемой совокупности элементов.
Какие существуют особенности анализа показателей финансово-хозяйственной деятельности экономического субъекта в рамках обязательного аудита?
Где используется корреляционно-регрессионный анализ?
ВАЖНО! Пример проведения корреляционно-регрессионного анализа от КонсультантПлюс доступен по ссылке
Основные ситуации применения КРА:
- Тестирование отношения между несколькими величинами: выявляется, что именно этот показатель является влияющим, а второй – зависимым.
- Определение связи между двумя переменными факторами без уточнения причинно-следственного блока сведений.
- Расчет показателя по изменению значения другого фактора.
Корреляционно-регрессионная методика анализа может применяться для подготовки данных о разных сторонах деятельности компании. В бизнесе построение моделей зависимости одного показателя от других факторов и дальнейшая эксплуатация выведенной математической формулы позволяют отслеживать оперативное изменение текущей ситуации в выбранном сегменте хозяйствования и быстро принимать управленческие решения.
Например, благодаря КРА можно постоянно отслеживать уровень рыночной стоимости предприятия. Для этого на начальных этапах проводится сбор информации о динамике изменения рыночной стоимости и статистических показателей всех возможных факторов влияния:
- уровень выручки;
- рентабельность;
- размер активов;
- сумма непогашенной дебиторской или кредиторской задолженности;
- резерв сомнительных долгов и др.
Для каждого критерия строится модель, которая выявляет, насколько сильно фактор может влиять на рыночную стоимость бизнес-проекта. Когда все модели построены, оценивается их работоспособность и адекватность. Из комплекса данных выбирается тот тип взаимосвязей, который отвечает требованиям объективности и достоверности. На основе полученной схемы связей создается уравнение, которое позволит получать прогнозные данные об изменении рыночной стоимости при условии изменения значения конкретного фактора.
Методику можно применять при формировании ценовой политики, составлении бизнес-планов, проработке вопроса о расширении ассортиментного ряда и в других сегментах предпринимательства.
Задачи, виды и показатели корреляционно-регрессионного анализа
Задачи КРА заключаются в:
- идентификации наиболее значимых факторов влияния на конкретный показатель деятельности предприятия;
- количественном измерении тесноты выявленных связей между показателями;
- определении неизвестных причин возникновения связей;
- всесторонней оценке факторов, которые признаны наиболее важными для рассматриваемого показателя;
- выведении формулы уравнения регрессии;
- составлении прогноза возможного результата деятельности при изменении ключевых связанных факторов с учетом возможного влияния других факторных признаков.
КРА подразумевает использование нескольких видов корреляционных и регрессионных методов. Зависимости выявляются при помощи корреляций таких типов:
- парная, если связь устанавливается с участием двух признаков;
- частная – взаимосвязь оценивается между искомым показателем и одним из ключевых факторов, при этом условием задается постоянное значение комплекса других факторов (то есть числовое выражение всех остальных факторов в любых ситуациях будет приниматься за определенную неизменную величину);
- множественная – основу исследования составляет влияние на показатель деятельности не одного фактора, а сразу нескольких критериев (двух и более).
СПРАВОЧНО! Выявленные показатели степени тесноты связей отражаются коэффициентом корреляции.
На выбор коэффициента влияет шкала измерения признаков:
- Шкала номинальная, которая предназначена для приведения описательных характеристик объектов.
- Шкала ординальная нужна для вычисления степени упорядоченности объектов в привязке к одному и более признакам.
- Шкала количественная используется для отражения количественных значений показателей.
Регрессионный анализ пользуется методом наименьших квадратов. Регрессия может быть линейной и множественной. Линейный тип предполагает модель из связей между двумя параметрами. Например, при наличии таких двух критериев, как урожайность клубники и полив, понятно, что именно объем поступающей влаги будет влиять на объем выращенной и собранной клубники. Если полив будет чрезмерным, то урожай пропадет. Урожайность же клубники никак не может воздействовать на систему полива.
Множественная регрессия учитывает более двух факторов одновременно. В случае с клубникой при оценке ее урожайности могут использоваться факторы полива, плодородности почвы, температурного режима, отсутствия слизняков, сортовые особенности, своевременность внесения удобрений. Все перечисленные показатели в совокупности оказывают комплексное воздействие на искомое значение – урожайность ягод.
Система показателей анализа формируется критериями классификации. Например, при экстенсивном типе развития бизнеса в качестве показателей могут выступать такие факторы:
- количество сотрудников;
- число заключенных договоров за отчетный период;
- посевные площади;
- прирост поголовья скота;
- расширение дилерской сети;
- объем основных фондов.
При интенсивном типе развития могут применяться следующие показатели:
- производительность труда;
- рентабельность;
- урожайность;
- фондоотдача;
- ликвидность;
- средний объем поставок в отчетном периоде по одному договору.
Оценка
Для оценки достоверности и эффективности модели связей необходимо построить матрицу коэффициентов. Коэффициент в случае парной корреляции вычисляется по формуле:
Диапазон значений коэффициента ограничивается показателями от -1 до +1. Если итоговое значение было получено со знаком плюс, то между рассматриваемыми переменными имеется прямая связь. Если в результате расчетов значение оказалось отрицательным, то связь будет обратной, то есть при увеличении одного из показателей другой связанный с ним фактор будет уменьшаться. Пример прямой связи – увеличение посевных площадей будет способствовать росту объема собираемой с полей продукции. Пример обратной связи – увеличение посевных площадей сопровождается снижением урожайности.
Качественный аспект тесноты связи между рассматриваемыми в аналитических расчетах показателями можно оценивать, основываясь на шкале Чеддока.
В соответствии с ее нормами связь будет расцениваться как сильная при значении коэффициента корреляции по абсолютным данным величины выше 0,7. Положительный или отрицательный знак сопровождает числовое значение – неважно, ориентироваться необходимо только на число. Если коэффициент после вычислений оказался ниже 0,3, то связь можно считать слабой.
Для дальнейших этапов анализа выбираются факторы с высокой степенью связанности. Все остальные критерии, для которых установлена слабая связь, отбрасываются. На основании полученных сведений определяется вид математического уравнения регрессии. Рассчитывается численное значение оценки параметров регрессии, определяются качества полученной модели регрессии.