Математические методы прогнозирования. Успехи современного естествознания

Экономико-математические методы. При использовании экономико-математических методов структура моделей устанавливается и проверяется экспериментально, в условиях, допускающих объективное наблюдение и измерение.

Определение системы факторов и причинно-следственной структуры исследуемого явления - начальный этап математического моделирования.

Статистические методы занимают особое место в прогнозировании. Методы математической и прикладной статистики используются при планировании любых работ по прогнозированию, при обработке данных, полученных как интуитивными, методами, так и при использовании собственно экономико-математических методов. В частности, с их помощью определяют численность групп экспертов, опрашиваемых граждан, периодичность сбора данных, оценивают параметры теоретических экономико-математических моделей.

Каждый из указанных методов обладает достоинствами и недостатками. Все методы прогнозирования дополняют друг друга и могут использоваться совместно.

Метод сценариев - эффективное средство для организации прогнозирования, объединяющего качественный и количественный подходы.

Сценарий - это модель будущего, в которой описывается возможный ход событий с указанием вероятностей их реализации. В сценарии определяются основные факторы, которые должны быть приняты во внимание, и указывается, каким образом эти факторы могут повлиять на предполагаемые события. Как правило, составляется несколько альтернативных вариантов сценариев. Сценарий, таким образом, - это характеристика будущего в изыскательском прогнозе, а не определение одного возможного или желательного состояния будущего. Обычно наиболее вероятный вариант сценария рассматривается в качестве базового, на основе которого принимаются решения. Другие варианты сценария, рассматриваемые в качестве альтернативных, планируются в том случае, если реальность в большей мере начинает приближаться к их содержанию, а не к базовому варианту сценария. Сценарии обычно представляют собой описание событий и оценки показателей и характеристик во времени. Метод подготовки сценариев вначале использовался для выявления возможных результатов военных действий. Позже сценарное прогнозирование стали применять в экономической политике, а затем и в стратегическом корпоративном планировании. Теперь это наиболее известный интеграционный механизм прогнозирования экономических процессов в условиях рынка. Сценарии являются эффективным средством преодолений традиционного мышления. Сценарий - это анализ быстро меняющегося настоящего и будущего, его подготовка заставляет заниматься деталями и процессами, которые могут быть упущены при изолированном использовании частных методов прогнозирования. Поэтому сценарий отличается от простого прогноза. Он является инструментом, который используется для определения видов прогнозов, которые должны быть разработаны, чтобы описать будущее с достаточной полнотой, с учетом всех главных факторов.

Использование сценарного прогнозирования в условиях рынке обеспечивает:

лучшее понимание ситуации, ее эволюции;

оценку потенциальных угроз;

выявление благоприятных возможностей;

выявление возможных и целесообразных направлений деятельности;

повышение уровня адаптации к изменениям внешней среды.

Сценарное прогнозирование является эффективным средство подготовки плановых решений как на предприятии, так и в государств.

Планирование тесно связано с прогнозированием, разделена этих процессов в известной мере условно, поэтому в планировании и прогнозировании могут использоваться одни и те же методы или тесно взаимосвязанные методы.

Решения об утверждении планов. Планы являются результатом управленческих решений, которые принимаются на основе возможных плановых альтернатив. Принятие управленческого решения осуществляется по некоторым критериям. Используя эти критерии, альтернативы оценивают с точки зрения достижения одной или нескольких целей. Критерии отражают цели, которые ставят лица, принимающие управленческие решения.

Решение, принимаемое по единственному критерию, считают простым, а по нескольким критериям - сложным. Критерии, в которых сформулированы количественные или порядковые шкалы оценок, позволяют использовать математические методы исследования операций для подготовки решений.

Решения об утверждении планов, как правило, являются не только сложными из-за множественности критериев, но и просто трудными по причинам неопределенности, ограниченности информации и высокой ответственности. Поэтому окончательные решения об утверждении планов принимаются путем эвристического, интуитивного выбора из ограниченного числа предварительно подготовленных альтернатив.

Методы планирования, таким образом, - это методы подготовки плановых альтернатив или, по меньшей мере, одного варианта плана для утверждения лицом или органом, принимающим решение.

Методы подготовки одного или нескольких вариантов планов различают по используемым методам составления этих планов, методам и срокам возможной реализации планов, объектам планирования.

Подобно прогнозированию, планирование может основываться на эвристических и математических методах. Среди математических методов исследования операций особое место занимают методы оптимального планирования.

Методы оптимального планирования. В решении задач подготовки оптимальных, то есть наилучших по определенным критериям, планов могут использоваться методы математического программирования.

Задачи математического программирования состоят в отыскании максимума или минимума некоторой функции при наличии ограничений на переменные - элементы решения. Известно большое количество типовых задач математического программирования, для решения которых разработаны эффективные методы, алгоритмы и программы для компьютеров, например:

Задачи о составе смеси, которые состоят в определении рациона, обладающего минимальной стоимостью и состоящего из разных продуктов с разным содержанием питательных веществ, по условию обеспечения в рационе содержания их не ниже определенного уровня;

Задачи об оптимальном плане производства, которые состоят в определении наилучшего по объему реализации или прибыли плана производства товаров при ограниченных ресурсах или производственных мощностях;

Транспортные задачи, суть которых - выбор плана перевозок, обеспечивающего минимум транспортных расходов при выполнении заданных объемов поставок потребителям в разных пунктах, при разных возможных маршрутах, из разных пунктов, в которых запасы или производственные мощности ограничены.

Методы теории игр могут использоваться для планирования условиях неопределенности погодных условий, ожидаемых сроков природных катаклизмов. Это "игры" с пассивным "игроком", который действует независимо от ваших планов.

Разработаны и методы решения задач теории игр с активным "игроками", которые действуют в ответ на действия противной стороны. Кроме того, развиты методы решения задач, в которых действия сторон характеризуются определенными стратегиями -наборами правил действий. Эти решения могут быть полезны при составлении планов в условиях возможного противодействия конкурентов, разнообразия в действиях партнеров.

Решения задач теории игр могут зависеть от уровня риска, который готовы допустить, или основываться просто на получении максимальной гарантированной выгоды. Решение определенных типов простых задач теории игр сводится к решению задач линейного программирования.

Опубликованы более подробные и корректные материалы по .

В марте 2011 года была опубликована заметка «Пять способов повысить точность прогнозирования» . Автор Алексей Скрипчан весьма дельно, просто и достаточно подробно рассмотрел в ней прогнозирование, которое необходимо выполнять в рамках маркетинга и планирования. Интересно звучит его эпитет в подразделе «Выгоды более точного прогнозирования» :

Прогнозирование становится рулем, помогающим компании держать курс, менять направление движения или уверенно плыть в незнакомых водах…

Мне бы хотелось добавить несколько слов к уже сказанному. Главным образом, необходимо отметить, что в упомянутой статье речь идет об экспертном прогнозировании. Нужно различать два вида прогнозирования: экспертное и формализованное .

Экспертное прогнозирование

Экспертное прогнозирование подразумевает формирование будущих значений экспертом, т.е. человеком, обладающим глубокими знаниями в определенной области. Эксперт при этом часто использует математический аппарат , однако в данном виде прогнозирования математический аппарат является лишь вспомогательным вычислительным инструментом. Основой же являются знания и интуиция эксперта, а потому иногда эти методы называют интуитивными .

Экспертное прогнозирование применяется тогда, когда объект прогнозирования либо слишком прост, либо, напротив, настолько сложен, что аналитически учесть влияние внешних факторов невозможно . Экспертные методы прогнозирования не предполагают разработку моделей прогнозирования и отражают индивидуальные суждения специалистов (экспертов) относительно перспектив развития процесса. К таким методам относятся следующие методы.

Метод экспертных оценок
Метод исторических аналогий
Метод предвидения по образцу
Нечеткая логика
Сценарное моделирование «что – если»

Формализованное прогнозирование - это прогнозирование на основании математической модели, которая, улавливая закономерности процесса , на своем выходе имеет будущие значения исследуемого процесса. довольно много, например, согласно ряду обзоров в настоящее время насчитывается свыше 100 классов моделей прогнозирования. Число общих классов моделей, которые в тех или иных вариациях повторяются в других, конечно, гораздо меньше и сводится легко к дюжине.

Регрессионные модели (regression model)
Авторегрессионные модели ( , AR)
Нейросетевые модели (artificial neural network , ANN)
Модели экспоненциального сглаживания ( , ES)
Модели на базе цепей Маркова (Markov chain)
Классификационно-регрессионные деревья (classification and regression trees , CART)
Метод опорных векторов (support vector machine , SVM)
Генетический алгоритм (genetic algorithm , GA)
Модель на основе передаточных функций (transfer function , TF)
Формализованная нечеткая логика (fuzzy logic , FL)
Фундаментальные модели

Автор статьи о прогнозировании в маркетинге совершенно верно отметил, что «как и любой инструмент, математика может быть опасной в руках дилетанта. Чтобы проверить собственные выкладки, можно привлечь кого-то с сильными статистическими навыками для анализа вашей информации ». Математические модели прогнозирования требуют развитых компетенций не только в математике, но и программировании, владении сложными статистическими пакетами для создания не только точной и быстрой модели.

Повышение точности прогнозирования

Безусловно, оба рассмотренных вида прогнозирования часто работают в совокупности, например, на основании сложного алгоритма вычисляются будущие значения временного ряда, а далее, эксперт проверяет эти цифры на адекватность. На этом этапе эксперт может внести ручные корректировки, которые при его высокой квалификации, способны положительно повлиять на качество прогноза.

Итого, если вам нужно повысить точность экспертного прогнозирования в задачах маркетинга, то вам нужно прямиком следовать данным в статье рекомендациям. Если же перед вами стоит задача повышения точности прогнозирования за счет сложных, быстрых, программно реализованных математических моделей, то стоит взглянуть в сторону , то есть прогноза, составленного на основании набора независимых прогнозов. В ближайшее время я буду говорить о консенсус-прогнозе в этом блоге подробнее.

В статье на конкретных примерах рассмотрены различные математические методы прогнозирования во времени, среди которых простая экстраполяция, методы, основанные на темпах роста, математическое моделирование. Показано, что выбор метода зависит от базы прогноза – информации за предыдущий временной период.

прогнозирование

биостатистика

1. Афанасьев В.Н., Юзбашев М.М. Анализ временных рядов и прогнозирование: Учебник. – М.: Финансы и статистика, 2001. – 228 с.

2. Петри А., Сэбин К. Наглядная статистика в медицине. – М.: ГЭОТАР-МЕД, 2003. – 144 с.

3. Садовникова Н.А., Шмойлова Р.А. Анализ временных рядов и прогнозирование: Учебное пособие. – М.: Изд. центр ЕАОИ, 2001. – 67 с.

Обычно под прогнозированием понимается процесс предсказания будущего основанное на некоторых данных из прошлого, т.е. изучается развитие интересующего явления во времени. Тогда прогнозируемая величина рассматривается как функция времени y=f(t) . Однако в медицине рассматриваются и другие виды прогноза : прогнозируется диагноз, диагностическая ценность нового теста, изменение одного фактора под действием другого и т.д.

Целью статьи было представить различные методы прогнозирования и подходы к их правильному использованию в медицине.

Материалы и методы исследования

В статье рассмотрены следующие методы прогнозирования: методы простой экстраполяции, метод скользящих средних, метод экспоненциального сглаживания, метод среднего абсолютного прироста, метод среднего темпа роста, методы прогнозирования на основе математических моделей.

Результаты исследования и их обсуждение

Как уже было отмечено, прогноз осуществляется на основании некоторой информации из прошлого (базы прогноза). Прежде чем подобрать метод прогнозирования полезно хотя бы качественно оценить динамику изучаемой величины в предыдущие моменты времени. На представленных графиках (рис. 1) видно, что она может быть различной.

Рис. 1. Примеры динамики изучаемой величины

В первом случае (график А) наблюдается относительная стабильность с небольшими колебаниями вокруг среднего значения. Во втором случае (график Б) динамика носит линейно возрастающий характер, в третьем (график В) - зависимость от времени нелинейная, экспоненциальная. Четвертый случай (график Г)- пример сложных колебаний, имеющих несколько составляющих.

Наиболее распространенным методом краткосрочного прогнозирования (1-3 временных периода), является экстраполяция, которая заключается в продлении предыдущих закономерностей на будущее. Применение экстраполяции в прогнозировании базируется на следующих предпосылках:

Развитие исследуемого явления в целом описывается плавной кривой;

Общая тенденция развития явления в прошлом и настоящем не претерпит серьезных изменений в будущем.

Первый метод из методов простой экстраполяции - это метод среднего уровня ряда. В этом методе прогнозируемый уровень изучаемой величины принимается равным среднему значению уровней ряда этой величины в прошлом. Этот метод используется, если средний уровень не имеет тенденции к изменению, или это изменение незначительно (нет явно выраженного тренда, рис. 1, график А)

где yпрог - прогнозируемый уровень изучаемой величины; yi - значение i-го уровня; n - база прогноза.

В некотором смысле отрезок динамического ряда, охваченный наблюдением, можно уподобить выборке, а значит, полученный прогноз будет выборочным, для которого можно указать доверительный интервал

где - среднеквадратичное отклонение временного ряда; tα -критерий Стъюдента для заданного уровня значимости и числа степеней свободы (n-1).

Пример. В табл. 1 приведены данные временного ряда y(t). Рассчитать прогнозное значение y на момент времени t =13 методом среднего уровня ряда.

Таблица 1

Данные временного ряда y(t)






		(80+98+94+103)/4
		(80+98+94+103+84)/5
		(80+98+94+103+84+115)/6
		(80+98+94+103+84+115+98)/7
		(80+98+94+103+84+115+98+113)/8
		(80+98+94+103+84+115+98+113+114)/9
		(80+98+94+103+84+115+98+113+114+87)/10
		(80+98+94+103+84+115+98+113+114+87+107)/11
		(80+98+94+103+84+115+98+113+114+87+107+85)/12

Исходный и сглаженный ряд представлены на рис. 2, расчет y - в табл. 2.

Рис. 2. Исходный и сглаженный ряд

Таблица 2

Доверительный интервал для прогноза в момент t =13

Метод скользящих средних - это метод прогнозирования на краткосрочный период, основан на процедуре сглаживания уровней изучаемой величины (фильтрации). Преимущественно используются линейные фильтры сглаживания с интервалом m, т.е.

Доверительный интервал

где - среднеквадратичное отклонение временного ряда; tα - критерий Стъюдента для заданного уровня значимости и числа степеней свободы (n-1).

Пример. В табл. 3 приведены данные временного ряда y(t). Рассчитать прогнозное значение y на момент времени t =13 методом скользящих средних с интервалом сглаживания m=3.

Исходный и сглаженный ряд представлены на рис. 3, расчет y - в табл. 4.

Таблица 3

Данные временного ряда y(t)

Рис. 3. Исходный и сглаженный ряд

Таблица 4

Прогнозное значение y

Метод экспоненциального сглаживания - это метод, при котором в процессе выравнивания каждого уровня используются значения предыдущих уровней, взятых с определенным весом. По мере удаления от какого-то уровня вес этого наблюдения уменьшается. Сглаженное значение уровня на момент времени t определяется по формуле

где St - текущее сглаженное значение; yt - текущее значение исходного ряда; St - 1 - предыдущее сглаженное значение; α - сглаживающая параметр.

S0 берется равным среднему арифметическому нескольких первых значений ряда.

Для расчета α предложена следующая формула

По поводу выбора α нет единого мнения, эта задача оптимизации модели пока еще не решена. В некоторых литературных источниках рекомендуется выбирать 0,1 ≤ α ≤ 0,3.

Прогноз рассчитывается следующим образом

Доверительный интервал

Таблица 5

Данные временного ряда y(t)



		0,3×80+(1-0,3)×90,7
		0,3×98+(1-0,3) ×87,5
		0,3×94+(1-0,3) ×90,6
		0,3⋅103+(1-0,3) ×91,6
		0,3×84+(1-0,3) ×95
		0,3⋅115+(1-0,3) ×91,7
		0,3×98+(1-0,3) ×98,7
		0,3⋅113+(1-0,3) ×98,5
		0,3⋅114+(1-0,3) ⋅102,8
		0,3×87+(1-0,3) ⋅106,2
		0,3⋅107+(1-0,3) ⋅100,4
		0,3×85+(1-0,3) ⋅102,4
		97,2+0,3× (85-97,2)

Исходный и сглаженный ряд представлены на рис. 4, расчет y - в табл. 6.

Рис. 4. Исходный и сглаженный ряд

Таблица 6

Прогнозное значение y на момент времени t =11

Следующий метод прогноза - это метод среднего абсолютного прироста Прогнозируемый уровень изучаемой величины изменяется в соответствии со средним абсолютным приростом этой величины в прошлом. Данный метод применяется, если общая тенденция в динамике линейна (для случая, приведенного на рис. 1, график Б)

где ; y0 - базовый уровень экстраполяции выбирается как среднее значение нескольких последних значений исходного ряда; - средний абсолютный прирост уровней ряда; l - число интервалов прогнози рования.

В качестве базового уровня принято усредненное значение последних значений ряда, максимально трех.

Таблица 7

Данные временного ряда y(t)

				Прогноз = y0+Δl



			(60+75+70)/3=68,3
			(75+70+103)/3=82,7
			(70+103+100)/3=91
			(103+100+115)/3=106
			(100+115+125)/3=113,3
			(115+125+113)/3=117,7
			(125+113+138)/3=125,3
			(113+138+136)/3=129
			(138+136+145)/3=139,7
			(136+145+150)/3=143,7	143,7+8,2⋅1=151,9
				143,7+8,2⋅2=160,1
				143,7+8,2⋅3=168,3

Исходный и сглаженный ряд представлены на рис. 5.

Рис. 5. Исходный и сглаженный ряд

Метод среднего темпа роста

Прогнозируемый уровень изучаемой величины изменяется в соответствии со средним темпом роста данной величины в прошлом. Данный метод применяется, если общая тенденция в динамике характеризуется показательной или экспоненциальной кривой (рис. 1В)

где - средний темп роста в прошлом; l - число интервалов прогнозирования.

Прогнозная оценка будет зависеть от того, в какую сторону от основной тенденции (тренда) отклоняется базовый уровень y0, поэтому рекомендуется рассчитывать y0 как усредненное значение нескольких последних значений ряда.

Таблица 8

Данные временного ряда y(t)




		62,5⋅1,081 = 67,7
	(70/60)1/2 =1,08	65⋅1,081 = 70,2
(65+70+68)/3=67,7	(68/60)1/3 =1,04	67,7⋅1,041 =70,5
(70+68+82)/3=73,3	(82/60)1/4 =1,08	73,3⋅1,081 =79,3
(68+82+80)/3=76,7	(80/60)1/5 =1,06	76,7⋅1,061 =81,2
(82+80+95)/3=85,7	(95/60)1/6 =1,08	85,7⋅1,081 =92,5
(80+95+113)/3=96	(113/60)1/7 =1,09	96⋅1,091 =105,1
(95+113+135)/3=114,3	(135/60)1/8 =1,11	114,3⋅1,111 =126,5
(113+135+140)/3=129,3	(140/60)1/9 =1,10	129,3⋅1,11 =142,1
(135+140+168)/3=147,7	(168/60)1/10 =1,11	147,7⋅1,111 =163,7
(140+168205)/3=171	(205/60)1/11 =1,12	171⋅1,121 =191,2
		171⋅1,122 =213,8
		171⋅1,123 =239,1

Исходный и сглаженный ряд представлены на рис. 6.

Рис. 6. Исходный и сглаженный ряд

На сегодняшний день наиболее распространенным методом прогнозирования является нахождение аналитического выражения (уравнения) тренда . Тренд экстраполируемого явления - это основная тенденция временного ряда, в некоторой мере свободная от случайных воздействий.

Разработка прогноза заключается в определении вида экстраполирующей функции y=f(t), которая выражает зависимость изучаемой величины от времени на основе исходных наблюдаемых данных. Первым этапом является выбор оптимального вида функции, дающей наилучшее описание тренда. Наиболее часто используются следующие зависимости:

Линейная ;

Параболическая ;

Показательная функция ;

Проблемы нахождения коэффициентов линейной функции и прогноз на ее основе рассматриваются в разделе статистики «регрессионный анализ». Если форма кривой, описывающей тренд, имеет нелинейный характер, то задача оценки функции y=f(t) усложняется, и в этом случае необходимо привлечь к анализу специалистов по биостатистике и воспользоваться компьютерными программами по статистической обработке данных.

В большинстве реальных случаев временной ряд представляет собой сложную кривую, которую можно представить как сумму или произведение трендовой, сезонной, циклической и случайной компонент.

Тренд представляет собой плавное изменение процесса во времени и обусловлен действием долговременных факторов. Сезонный эффект связан с наличием факторов, действующих с заранее известной периодичностью (например, времена года, лунные циклы). Циклическая компонента описывает длительные периоды относительного подъема и спада, состоит из циклов переменной длительности и амплитуды (например, некоторые эпидемии имеют длительный циклический характер). Случайная составляющая ряда отражает воздействие многочисленных факторов случайного характера и может иметь разнообразную структуру.

Заключение

Методы простой экстраполяции, метод скользящих средних, метод экспоненциального сглаживания являются простейшими, и в тоже время самыми приближенными - это видно из широких доверительных интервалов в приведенных примерах. Большая погрешность прогноза наблюдается в случае сильных колебаний уровней. Следует обратить внимание на то, что неправомерно использовать эти методы при наличии явной тенденции к росту (или падению) исходного временного ряда. Тем не менее, для краткосрочных прогнозов их применение бывает оправданным.

Анализ всех компонентов временного ряда и прогнозирование на их основе задача нетривиальная, рассматривается в разделе статистики «анализ временных рядов» и требует специальной подготовки.

Библиографическая ссылка

Койчубеков Б.К., Сорокина М.А., Мхитарян К.Э. МАТЕМАТИЧЕСКИЕ МЕТОДЫ ПРОГНОЗИРОВАНИЯ В МЕДИЦИНЕ // Успехи современного естествознания. – 2014. – № 4. – С. 29-36;
URL: http://natural-sciences.ru/ru/article/view?id=33316 (дата обращения: 30.03.2019). Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания» 23 апреля 2013 в 11:08

Классификация методов и моделей прогнозирования

Математика

Tutorial

Я занимаюсь прогнозированием временных рядов уже более 5 лет. В прошлом году мною была защищена диссертация по теме «Модель прогнозирования временных рядов по выборке максимального подобия », однако вопросов после защиты осталось порядочно. Вот один из них — общая классификация методов и моделей прогнозирования .

Обычно в работах как отечественных, так и англоязычных авторы не задаются вопросом классификации методов и моделей прогнозирования, а просто их перечисляют. Но мне кажется, что на сегодняшний день данная область так разрослась и расширилась, что пусть самая общая, но классификация необходима. Ниже представлен мой собственный вариант общей классификации.

В чем разница между методом и моделью прогнозирования?

Метод прогнозирования представляет собой последовательность действий, которые нужно совершить для получения модели прогнозирования. По аналогии с кулинарией метод есть последовательность действий, согласно которой готовится блюдо — то есть сделается прогноз.

Модель прогнозирования есть функциональное представление, адекватно описывающее исследуемый процесс и являющееся основой для получения его будущих значений. В той же кулинарной аналогии модель есть список ингредиентов и их соотношение, необходимый для нашего блюда — прогноза.

Совокупность метода и модели образуют полный рецепт!

В настоящее время принято использовать английские аббревиатуры названий как моделей, так и методов. Например, существует знаменитая модель прогнозирования авторегрессия проинтегрированного скользящего среднего с учетом внешнего фактора (auto regression integrated moving average extended, ARIMAX). Эту модель и соответствующий ей метод обычно называют ARIMAX, а иногда моделью (методом) Бокса-Дженкинса по имени авторов.

Сначала классифицируем методы

Если посмотреть внимательно, то быстро выясняется, что понятие «метод прогнозирования » гораздо шире понятия «модель прогнозирования ». В связи с этим на первом этапе классификации обычно делят методы на две группы: интуитивные и формализованные .

Если мы вспомним нашу кулинарную аналогию, то и там можно разделить все рецепты на формализованные, то есть записанные по количеству ингредиентов и способу приготовления, и интуитивные, то есть нигде не записанные и получаемые из опыта кулинара. Когда мы не пользуемся рецептом? Когда блюдо очень просто: пожарить картошку или сварить пельмени — тут рецепт не нужен. Когда еще мы не пользуемся рецептом? Когда желаем изобрести что-то новенькое!

Интуитивные методы прогнозирования имеют дело с суждениями и оценками экспертов. На сегодняшний день они часто применяются в маркетинге, экономике, политике, так как система, поведение которой необходимо спрогнозировать, или очень сложна и не поддается математическому описанию, или очень проста и в таком описании не нуждается. Подробности о такого рода методах можно глянуть в .

Формализованные методы — описанные в литературе методы прогнозирования, в результате которых строят модели прогнозирования, то есть определяют такую математическую зависимость, которая позволяет вычислить будущее значение процесса, то есть сделать прогноз.

На этом общая классификация методов прогнозирования на мой взгляд может быть закончена.

Далее сделаем общую классификация моделей

Здесь необходимо переходить к классификации моделей прогнозирования. На первом этапе модели следует разделить на две группы: модели предметной области и модели временных рядов.

Модели предметной области — такие математические модели прогнозирования, для построения которых используют законы предметной области. Например, модель, на которой делают прогноз погоды, содержит уравнения динамики жидкостей и термодинамики. Прогноз развития популяции делается на модели, построенной на дифференциальном уравнении. Прогноз уровня сахара крови человека, больного диабетом, делается на основании системы дифференциальных уравнений. Словом, в таких моделях используются зависимости, свойственные конкретной предметной области. Такого рода моделям свойственен индивидуальный подход в разработке.

Модели временных рядов — математические модели прогнозирования, которые стремятся найти зависимость будущего значения от прошлого внутри самого процесса и на этой зависимости вычислить прогноз. Эти модели универсальны для различных предметных областей, то есть их общий вид не меняется в зависимости от природы временного ряда. Мы можем использовать нейронные сети для прогнозирования температуры воздуха, а после аналогичную модель на нейронных сетях применить для прогноза биржевых индексов. Это обобщенные модели, как кипяток, в которые если бросить продукт, то он сварится вне зависимости от его природы.

Классифицируем модели временных рядов

Мне кажется, что составить общую классификацию моделей предметной области не представляется возможным: сколько областей, столько и моделей! Однако модели временных рядов легко поддаются простому делению . Модели временных рядов можно разделить на две группы: статистические и структурные.

В статистических моделях зависимость будущего значения от прошлого задается в виде некоторого уравнения. К ним относятся:

регрессионные модели (линейная регрессия, нелинейная регрессия);
авторегрессионные модели (ARIMAX, GARCH, ARDLM);
модель экспоненциального сглаживания;
модель по выборке максимального подобия;
и т.д.

В структурных моделях зависимость будущего значения от прошлого задается в виде некоторой структуры и правил перехода по ней. К ним относятся:

нейросетевые модели;
модели на базе цепей Маркова;
модели на базе классификационно-регрессионных деревьев;
и т.д.

Для обоих групп я указала основные, то есть наиболее распространенные и подробно описанные модели прогнозирования. Однако на сегодняшний день моделей прогнозирования временных рядов имеется уже громадное количество и для построения прогнозов, например, стали использовать SVM (support vector machine) модели, GA (genetic algorithm) модели и многие другие.

Общая классификация

Таким образом мы получили следующую классификацию моделей и методов прогнозирования .

Тихонов Э.Е. Прогнозирование в условиях рынка. Невинномысск, 2006. 221 с.
Armstrong J.S. Forecasting for Marketing // Quantitative Methods in Marketing. London: International Thompson Business Press, 1999. P. 92 – 119.
Jingfei Yang M. Sc. Power System Short-term Load Forecasting: Thesis for Ph.d degree. Germany, Darmstadt, Elektrotechnik und Informationstechnik der Technischen Universitat, 2006. 139 p.

UPD. 15.11.2016.
Господа, дошло до маразма! Недавно мне прислали на рецензию статью для ВАКовского издания со ссылкой на эту запись. Обращаю внимание, что ни в дипломах, ни в статьях, ни тем более в диссертациях ссылаться на блог нельзя ! Если хотите ссылку, то используйте эту: Чучуева И.А. МОДЕЛЬ ПРОГНОЗИРОВАНИЯ ВРЕМЕННЫХ РЯДОВ ПО ВЫБОРКЕ МАКСИМАЛЬНОГО ПОДОБИЯ, диссертация… канд. тех. наук / Московский государственный технический университет им. Н.Э. Баумана. Москва, 2012.

Приложение 1. МЕТОДЫ СТАТИСТИЧЕСКОГО АНАЛИЗА И ПРОГНОЗИРОВАНИЯ В БИЗНЕСЕ

4. Математический инструментарий прогнозирования

Математические методы и модели, используемые в задачах стохастического анализа и прогнозирования в бизнесе, могут относиться к самым различным разделам математики: к регрессионному анализу, анализу временных рядов, формированию и оцениванию экспертных мнений, имитационному моделированию, системам одновременных уравнений, дискриминантному анализу, логит- и пробит-моделям, аппарату логических решающих функций, дисперсионному или ковариационному анализу, анализу ранговых корреляций и таблиц сопряженности и т. д. Однако все они объединены тем, что представляют собой различные подходы к решению центральной проблемы многомерного статистического анализа и эконометрики – проблемы статистического исследования зависимостей , которая, как раз, и является базовой проблемой статистического анализа и прогнозирования в бизнесе (ее общая формулировка была приведена в п. 2).

В п. 1 уже было замечено, что среди p + k + l + m компонент анализируемого многомерного признака могут быть как количественные, так и ординальные и номинальные переменные. Упомянутые выше подходы к решению центральной проблемы многомерного статистического анализа формировались именно с учетом природы исследуемых переменных. Соответствующая специализация этих подходов отражена в табл. 4. В ней же даны ссылки на литературные источники, в которых можно найти достаточно полное описание этих подходов.

Таблица 4.

Природа результирующих показателей	Природа объясняющих переменных	Название обслуживающих разделов многомерного статистического анализа	Литературные источники

Количественная	Количественная	Регрессионный анализ и системы одновременных уравнений
Количественная	Единственная количественная переменная, интерпретируемая как «время»	Анализ временных рядов
Количественная	Неколичественная (ординальные или номинальные переменные)	Дисперсионный анализ
Количественная		Ковариационный анализ, модели типологической регрессии
Неколичественная (ординальные переменные)	Неколичественная (ординальные и номинальные переменные)	Анализ ранговых корреляций и таблиц сопряженности
Неколичественная (номинальные переменные)	Количественная	Дискриминантный анализ, логит- и пробит-модели, кластер-анализ, таксономия, расщепление смесей распределений
Смешанная (количественные и неколичественные переменные)	Смешанная (количественные и неколичественные переменные)	Аппарат логических решающих функций, Data Mining

Тем не менее, практика статистического анализа и прогнозирования в бизнесе свидетельствует о том, что во всем спектре их математического инструментария бесспорное лидерство (по распространенности и актуальности) принадлежит трем разделам:
- регрессионному анализу;
- анализу временных рядов;
- механизму формирования и статистического анализа экспертных оценок.

Кратко остановимся на каждом из этих разделов.

Регрессионный анализ

Как и прежде, будем описывать функционирование исследуемого реального объекта (фирмы, компании, процесса производства или дистрибуции продукции и т. п.) набором переменных и (их содержательный смысл описан в п. 2). Введем ряд определений и понятий, используемых в регрессионном анализе.

Результирующие (зависимые, эндогенные) переменные. Переменная , характеризующая результат или эффективность функционирования анализируемой системы, называется результирующей (зависимой, эндогенной). Ее значения формируются в процессе и внутри функционирования этой системы под воздействием ряда других переменных и факторов, часть из которых поддается регистрации и, в определенной степени, управлению и планированию (эту часть принято называть объясняющими переменными, см. ниже). В регрессионном анализе результирующая переменная выступает в роли функции, значения которой определяются (правда, с некоторой случайной погрешностью) значениями упомянутых выше объясняющих переменных, выступающих в роли аргументов. Поэтому по природе своей результирующая переменная всегда стохастична (случайна). В общем случае обычно анализируется поведение сразу нескольких результирующих переменных .

Объясняющие (предикторные, экзогенные) переменные . Переменные (или признаки), поддающиеся регистрации, описывающие условия функционирования изучаемой реальной экономической системы и в существенной мере определяющие процесс формирования значений результирующих переменных, называются объясняющими. Как правило, часть из них поддается хотя бы частичному регулированию и управлению. Значения ряда объясняющих переменных могут задаваться как бы «извне» анализируемой системы. В этом случае их принято называть экзогенными. В регрессионном анализе они играют роль аргументов той функции, в качестве которой рассматривается анализируемый результирующий показатель . По своей природе объясняющие переменные могут быть как случайными, так и неслучайными.

Регрессионные остатки – это латентные (т. е. скрытые, не поддающиеся непосредственному измерению) случайные компоненты, отражающие влияние соответственно на не учтенных в составе факторов, а также случайные ошибки в измерении анализируемых результирующих переменных. Они, вообще говоря, тоже могут зависеть от , т. е. в общем случае .

Общая схема взаимодействия переменных в регрессионном анализе изображена на рисунке.

Рисунок . Общая схема взаимодействия переменных в регрессионном анализе.

Функция регрессии по . Функция называется функцией регрессии по (или просто – регрессией по ), если она описывает изменение условного среднего значения результирующей переменной (при условии, что значения объясняющих переменных зафиксированы на уровнях ) в зависимости от изменения значений объясняющих переменных. Соответственно математически это определение может быть записано в виде

где символ означает операцию теоретического усреднения значений (т. е. – это математическое ожидание случайной величины , а , или просто – это условное математическое ожидание случайной величины , вычисленное при условии, что значения объясняющих переменных зафиксированы на уровне ).

Если мы анализируем одновременно результирующих переменных , то следует рассмотреть соответственно функций регрессий или, что то же, одну векторнозначную функцию

. (11)

Тогда модель регрессии по может быть записана в виде

, (12)

причем, из определения следует, что всегда]

(12’)

(тождественный знак равенства в (12’) означает, что оно справедливо при любых значениях ; вектор-столбец из нулей в правой части имеет размерность ).

задача регрессионного анализа в самом общем виде может быть сформулирована следующим образом:

по результатам измерений

исследуемых переменных на объектах (системах, процессах) анализируемой совокупности построить такую (векторнозначную) функцию (11), которая позволила бы наилучшим (в определенном смысле) образом восстанавливать значения результирующих (прогнозируемых) переменных по заданным значениям объясняющих (экзогенных) переменных .

З а м е ч а н и е 1. Наиболее распространенными являются линейные модели регрессии, т. е. модели, в которых функции регрессии имеют линейный вид:

З а м е ч а н и е 2. Существует по меньшей мере два варианта интерпретации введенных в п. 2 «поведенческих», «статусных» и «внешних» переменных, соответственно, и в рамках описанной модели регрессии (12)–(12’). В первом варианте все три типа переменных и относят к объясняющим переменным и строят регрессию по . В другом варианте переменные и интерпретируют как условия проведения наблюдений и тогда отдельно для каждого фиксированного сочетания этих условий строят регрессионную модель вида (12) (в рамках линейной модели (12 ’’) это будет означать, что сами коэффициенты регрессии зависят от и , т. е. определяются как функции от и ).

Анализ временных рядов

Всякий статистический анализ и прогноз основывается на исходных статистических данных. Их основные типы были представлены в п. 1. При этом, если процесс регистрации данных происходит во времени , и само время фиксируется наряду со значениями анализируемых характеристик , то говорят о статистическом анализе так называемых панельных данных . Если зафиксировать номер переменной и номер статистически обследуемого объекта , то расположенную в хронологическом порядке последовательность значений

называют одномерным временным рядом . Если же одновременно рассматривать одномерных временных рядов вида (13), т. е. исследовать закономерности во взаимосвязанном поведении временных рядов (13) для , характеризующих динамику переменных, измеренных на каком-то одном ( -м) объекте , то тогда говорят о статистическом анализе многомерного временного ряда . По существу, все задачи, связанные с анализом экономической динамики и прогнозом, предусматривают использование в качестве своей статистической базы временных рядов тех или иных показателей.

Как правило, в задачах бизнес-прогнозирования рассматриваются лишь дискретные (по времени наблюдения ) одномерные временные ряды для равноотстоящих моментов наблюдения , т. е. где – заданный временной такт (минута, час, сутки, неделя, месяц, квартал, год и т. п.). В этих случаях исследуемый временной ряд нам будет удобнее представлять в виде

где – значение анализируемого показателя, зарегистрированное в -м такте времени .

Говоря об использовании аппарата анализа временных рядов в проблеме прогнозирования, мы имеем в виду кратко - и среднесрочный прогноз , поскольку построение долгосрочного прогноза подразумевает обязательное использование методов организации и статистического анализа специальных экспертных оценок .

Генезис наблюдений, образующих временной ряд . Речь идет о структуре и классификации основных факторов, под воздействием которых формируются значения элементов временного ряда. Целесообразно выделить следующие 4 типа таких факторов.

(А) Долговременные , формирующие общую (в длительной перспективе) тенденцию в изменении анализируемого признака . Обычно эта тенденция описывается с помощью той или иной неслучайной функции f тр (t), как правило, монотонной. Эту функцию называют функцией тренда или просто трендом .

(Б) Сезонные , формирующие периодически повторяющиеся в определенное время года колебания анализируемого признака. Условимся обозначать результат действия сезонных факторов с помощью неслучайной функции . Поскольку эта функция должна быть периодической (с периодами, кратными сезонам, т. е. кварталам), в ее аналитическом выражении участвуют гармоники (тригонометрические функции), периодичность которых, как правило, обусловлена содержательной сущностью задачи.

(В) Циклические (конъюнктурные ), формирующие изменения анализируемого признака, обусловленные действием долговременных циклов экономической, демографической или астрофизической природы (волны Кондратьева, демографические «ямы», циклы солнечной активности и т. п.). Результат действия циклических факторов будем обозначать с помощью неслучайной функции .

(Г) Случайные (нерегулярные), не поддающиеся учету и регистрации. Их воздействие на формирование значений временного ряда как раз и обусловливает стохастическую природу элементов , а следовательно, и необходимость интерпретации как наблюдений, произведенных над случайными величинами соответственно . Будем обозначать результат воздействия случайных факторов с помощью случайных величин («остатков», «ошибок») . Конечно, вовсе не обязательно, чтобы в процессе формирования значений всякого временного ряда участвовали одновременно факторы всех четырех типов. В одних случаях значения временного ряда могут формироваться под воздействием факторов (А), (Б) и (Г), в других – под воздействием факторов (А), (В) и (Г) и, наконец, – исключительно под воздействием одних только случайных факторов (Г). Однако во всех случаях предполагается непременное участие случайных (эволюционных ) факторов (Г). Кроме того, как правило, принимается (в качестве гипотезы) аддитивная структурная схема влияния факторов (А), (Б), (В) и (Г) на формирование значений , которая означает правомерность представления значений членов временного ряда в виде разложения:

Выводы о том, участвуют или нет факторы данного типа в формировании значений , могут базироваться как на анализе содержательной сущности задачи (т. е. быть априорно-экспертными по своей природе ), так и на специальном статистическом анализе исследуемого временного ряда .

В рамках введенных понятий и обозначений задача статистического анализа временного ряда в общем виде может быть сформулирована следующим образом:

по результатам измерений исследуемой переменной за тактов времени базового периода построить наилучшие (в определенном смысле) оценки для членов разложения (14).

Решение этой задачи используется для построения прогнозного значения на тактов времени вперед с помощью формулы (14) при и при подстановке в нее полученных оценок компонентов правой части разложения.

Механизмы формирования и статистический анализ экспертных оценок

Обычно выделяются следующие основные типы организации работы группы экспертов ():

· коллегиальный : «метод комиссий» (в виде открытой дискуссии по обсуждаемой проблеме); «метод суда» (в виде противостояния «защиты» и «обвинения» по каждому из вариантов обсуждаемого решения проблемы); «мозговая атака» и т.п.;

· частично коллегиальный: сценарный анализ типа «что – если», метод «Делфи» – многотуровое обсуждение проблемы с тайным голосованием экспертов или заполнением специальных анонимных анкет в конце каждого тура и работой независимой аналитической группы в промежутках между турами и т.п.;

· индивидуально-автономный: каждый из участников экспертной группы формирует и высказывает свое мнение (независимо от позиций других участников) в виде ранжирования обсуждаемых вариантов решения (или объектов), их парных сравнений или отнесения каждого из них к одной из заранее описанных градаций (см. формы представления исходных статистических данных в виде таблиц частот или таблиц сопряженности в между мнениями -го и -го экспертов измеряют величиной , где – коэффициент ранговой корреляции Спирмена (см. , гл. 11]). Определив тот или иной способ вычисления «расстояния» между мнениями пары экспертов, мы можем решать затем задачу «кластеризации» экспертов, интерпретируя каждый из найденных таким образом кластер как группу экспертов-единомышленников.

(ii) Анализ взаимной согласованности мнений группы экспертов. Располагая мнениями целой группы экспертов, аналитик-статистик стремится оценить степень согласованности всех этих экспертных оценок, в том числе и статистически проверить гипотезу о полном отсутствии какой-либо их согласованности (и тогда, очевидно, следует либо уточнить постановку предложенной экспертам задачи, либо поменять состав экспертной группы). Эта задача также решается средствами многомерного статистического анализа. Выбор конкретного метода зависит от формы исходных статистических данных. Например, если мнения экспертов представлены ранжировками, то в качестве меры их согласованности можно рассматривать коэффициент объектов), т.е. при исходных статистических данных вида определяется как решение оптимизационной задачи видаj -го эксперта отстоит от единого группового мнения, тем ниже оценивается уровень его относительной компетентности. Заметим, что если в результате исследования структуры совокупности экспертных мнений аналитик-статистик приходит к выводу о наличии нескольких подгрупп экспертов с однородностью мнений внутри каждой подгруппы и с существенным различием мнений в любой паре таких подгрупп, то задача единого группового мнения и оценка относительной компетентности эксперта решается отдельно для каждой из выявленных подгрупп.

Случайные факторы, в свою очередь, могут быть двоякой природы: внезапными («разладочными»), приводящими к скачкообразным структурным изменениям в механизме формирования значений x(t) (что выражается, например, в радикальных скачкообразных изменениях основных структурных характеристик функций f тр (t), j (t) и y (t) анализируемого временного ряда в случайный момент времени), и эволюционными остаточными , обусловливающими относительно небольшие случайные отклонения значений x(t) от тех, которые должны были бы получиться только под воздействием факторов (А), (Б) и (В). Однако в данном разделе будут рассмотрены схемы формирования временных рядов, включающие в себя действие только эволюционных остаточных случайных факторов.