Méthodes mathématiques de prévision. Succès des sciences naturelles modernes

Méthodes économiques et mathématiques. Lors de l'utilisation de méthodes économiques et mathématiques, la structure des modèles est établie et vérifiée expérimentalement, dans des conditions qui permettent une observation et une mesure objectives.

La détermination du système de facteurs et de la structure causale du phénomène étudié est la première étape de la modélisation mathématique.

Les méthodes statistiques occupent une place particulière dans la prévision. Les méthodes de la statistique mathématique et appliquée sont utilisées dans la planification de tout travail de prévision, dans le traitement des données obtenues à la fois par des méthodes intuitives et par l'utilisation de méthodes économiques et mathématiques proprement dites. Ils permettent notamment de déterminer le nombre de groupes d'experts, de citoyens interrogés, la fréquence de collecte des données, et d'évaluer les paramètres des modèles théoriques économiques et mathématiques.

Chacune de ces méthodes présente des avantages et des inconvénients. Toutes les méthodes de prévision se complètent et peuvent être utilisées ensemble.

Méthode du scénario- un outil efficace d'organisation de la prévision, combinant approches qualitative et quantitative.

Un scénario est un modèle du futur, qui décrit le cours possible des événements, en indiquant les probabilités de leur mise en œuvre. Le scénario identifie les principaux facteurs à prendre en compte et indique comment ces facteurs peuvent affecter les événements attendus. En règle générale, plusieurs scénarios alternatifs sont compilés. Un scénario est donc une caractérisation du futur dans une prévision exploratoire, et non une définition d'un état futur possible ou souhaité. Habituellement, la variante la plus probable du scénario est considérée comme la variante de base, sur la base de laquelle les décisions sont prises. D'autres versions du scénario, considérées comme alternatives, sont prévues au cas où la réalité commencerait à se rapprocher davantage de leur contenu, et non de la version de base du scénario. Les scénarios sont généralement des descriptions d'événements et des estimations d'indicateurs et de caractéristiques au fil du temps. La méthode de préparation de scénarios a d'abord été utilisée pour identifier les issues possibles d'opérations militaires. Plus tard, la prévision de scénarios a commencé à être utilisée dans la politique économique, puis dans la planification stratégique des entreprises. C'est maintenant le mécanisme d'intégration le plus connu pour prévoir les processus économiques sur le marché. Les scripts sont un moyen efficace de surmonter la pensée traditionnelle. Un scénario est une analyse d'un présent et d'un futur en évolution rapide, et sa préparation oblige à traiter des détails et des processus qui peuvent être manqués lors de l'utilisation isolée de méthodes de prévision particulières. Par conséquent, le scénario diffère d'une simple prévision. C'est un outil qui permet de déterminer les types de prévisions à développer pour décrire l'avenir avec suffisamment d'exhaustivité, en tenant compte de tous les principaux facteurs.


L'utilisation de la prévision de scénarios dans des conditions de marché fournit :

meilleure compréhension de la situation, de son évolution ;

évaluation des menaces potentielles;

identifier les opportunités ;

identification des directions d'activité possibles et opportunes;

augmenter le niveau d'adaptation aux changements de l'environnement extérieur.

La prévision de scénarios est un moyen efficace de préparer des décisions planifiées à la fois dans une entreprise et dans les États.

La planification est étroitement liée à la prévision, ces processus sont divisés dans une certaine mesure conditionnellement, par conséquent, les mêmes méthodes ou des méthodes étroitement liées peuvent être utilisées dans la planification et la prévision.

Planifier les décisions d'approbation. Les plans sont le résultat de décisions de gestion qui sont prises sur la base d'alternatives de planification possibles. Les décisions de gestion sont prises selon certains critères. À l'aide de ces critères, les alternatives sont évaluées en termes d'atteinte d'un ou de plusieurs objectifs. Les critères reflètent les objectifs fixés par les décideurs.

Une décision basée sur un seul critère est considérée comme simple, et une décision basée sur plusieurs critères est considérée comme complexe. Les critères, dans lesquels des échelles de notation quantitatives ou ordinales sont formulées, permettent d'utiliser des méthodes mathématiques de recherche opérationnelle pour préparer des solutions.

Les décisions d'approbation des plans ont tendance à être non seulement complexes en raison de multiples critères, mais carrément difficiles en raison de l'incertitude, des informations limitées et de la responsabilité élevée. Par conséquent, les décisions finales sur l'approbation des plans sont prises par une sélection heuristique et intuitive à partir d'un nombre limité d'alternatives préparées à l'avance.

Les méthodes de planification sont donc des méthodes d'élaboration d'alternatives d'aménagement, ou d'au moins une option d'aménagement, pour approbation par un décideur ou une instance.

Les méthodes d'élaboration d'une ou plusieurs variantes de plans se distinguent par les méthodes utilisées pour l'élaboration de ces plans, les méthodes et modalités de mise en œuvre éventuelle des plans, les objets de planification.

Comme la prévision, la planification peut être basée sur des méthodes heuristiques et mathématiques. Parmi les méthodes mathématiques de la recherche opérationnelle, les méthodes de planification optimale occupent une place particulière.

Méthodes de planification optimale. Pour résoudre les problèmes de préparation optimale, c'est-à-dire la meilleure selon certains critères, des plans, des méthodes de programmation mathématique peuvent être utilisés.

Les tâches de la programmation mathématique consistent à trouver le maximum ou le minimum d'une certaine fonction en présence de restrictions sur les variables - les éléments de la solution. Un grand nombre de problèmes typiques de programmation mathématique sont connus, pour la solution desquels des méthodes, algorithmes et programmes efficaces pour ordinateurs ont été développés, par exemple:

Tâches sur la composition du mélange, qui consistent à déterminer un régime qui a un coût minimum et se compose de différents produits avec une teneur en nutriments différente, à condition de s'assurer que leur teneur dans le régime n'est pas inférieure à un certain niveau ;

Tâches sur le plan de production optimal, qui consistent à déterminer le meilleur plan de production de biens en termes de volume de ventes ou de profit avec des ressources ou des capacités de production limitées ;

Tâches de transport, dont l'essence est le choix d'un plan de transport qui offre un minimum de coûts de transport lors de l'exécution de volumes donnés de livraisons aux consommateurs en différents points, avec différents itinéraires possibles, à partir de différents points où les stocks ou les capacités de production sont limités.

Les méthodes de la théorie des jeux peuvent être utilisées pour planifier des conditions météorologiques incertaines, le moment prévu des catastrophes naturelles. Ce sont des "jeux" avec un "joueur" passif qui agit indépendamment de vos plans.

Des méthodes ont également été développées pour résoudre des problèmes de théorie des jeux avec des "joueurs" actifs qui agissent en réponse aux actions du côté opposé. De plus, des méthodes ont été développées pour résoudre des problèmes dans lesquels les actions des parties sont caractérisées par certaines stratégies - des ensembles de règles d'action. Ces décisions peuvent être utiles lors de l'élaboration des plans face à une éventuelle opposition des concurrents, à la diversité des actions des partenaires.

Les solutions aux problèmes de la théorie des jeux peuvent dépendre du niveau de risque que l'on est prêt à accepter, ou être simplement basées sur l'obtention du bénéfice maximum garanti. La résolution de certains types de problèmes simples de théorie des jeux est réduite à la résolution de problèmes de programmation linéaire.

Des matériaux plus détaillés et corrects ont été publiés sur .

En mars 2011, la note "Cinq façons d'améliorer la précision des prévisions" a été publiée. L'auteur Aleksey Skripchan a examiné de manière très efficace, simple et suffisamment détaillée les prévisions qui doivent être effectuées dans le cadre du marketing et de la planification. Son épithète semble intéressante dans la sous-section "Les avantages d'une meilleure prévision":

La prévision devient le gouvernail qui aide une entreprise à maintenir le cap, à changer de direction ou à naviguer en eaux inconnues en toute confiance…

Je voudrais ajouter quelques mots à ce qui a déjà été dit. Principalement, il convient de noter que dans l'article mentionné, nous parlons de prévisions d'experts. Besoin de distinguer deux types de prévision : experte et formalisée.

Prévision experte

La prévision experte implique la formation de valeurs futures par un expert, c'est-à-dire une personne ayant des connaissances approfondies dans un domaine particulier. Dans ce cas, l'expert utilise souvent l'appareil mathématique, cependant, dans ce type de prévision, l'appareil mathématique n'est qu'un outil de calcul auxiliaire. La base est la connaissance et l'intuition d'un expert, et donc parfois ces les méthodes sont dites intuitives.

La prévision experte est utilisée lorsque l'objet de prévision est soit trop simple, soit au contraire tellement complexe qu'il est impossible de prendre en compte analytiquement l'influence de facteurs externes.. Les méthodes de prévision expertes n'impliquent pas le développement de modèles de prévision et reflètent les jugements individuels de spécialistes (experts) concernant les perspectives de développement du processus. Ces méthodes comprennent les méthodes suivantes.

  • Mode d'expertise
  • Méthode des analogies historiques
  • Prospective par modèle
  • logique floue
  • Modélisation de scénarios "et si"

Une prévision formalisée est une prévision basée sur modèle mathématique, qui, capturant les schémas du processus, présente à sa sortie les valeurs futures du procédé à l'étude. beaucoup, par exemple, selon un certain nombre de revues, il existe actuellement plus de 100 classes de modèles de prévision. Le nombre de classes générales de modèles qui se répètent dans une variante ou une autre dans d'autres est, bien sûr, beaucoup plus petit et peut facilement être réduit à une douzaine.

  • Modèles de régression(Modèle de régression)
  • Modèles autorégressifs( ,AR)
  • Modèles de réseaux neuronaux(réseau de neurones artificiels, ANN)
  • Modèles de lissage exponentiel( ,ES)
  • Modèles basés sur les chaînes de Markov(chaîne de Markov)
  • Arbres de classification-régression(arbres de classification et de régression, CART)
  • Soutenir la machine vectorielle(machine à vecteur de support, SVM)
  • algorithme génétique(algorithme génétique, GA)
  • Modèle de fonction de transfert(fonction de transfert , TF)
  • Logique floue formalisée(logique floue, FL)
  • Modèles fondamentaux

L'auteur d'un article sur la prévision en marketing notait à juste titre que « comme tout outil, les mathématiques peuvent être dangereuses entre les mains d'un amateur. Pour vérifier vos propres calculs, vous pouvez impliquer une personne ayant de solides compétences statistiques pour analyser vos informations.». Modèles mathématiques de prévision nécessitent des compétences développées non seulement en mathématiques, mais aussi en programmation, la possession de packages statistiques complexes pour créer non seulement un modèle précis et rapide.

Amélioration de la précision des prévisions

Bien sûr, les deux types de prévisions considérés fonctionnent souvent ensemble, par exemple, sur la base d'un algorithme complexe, les valeurs futures de la série chronologique sont calculées, puis l'expert vérifie l'adéquation de ces chiffres. À ce stade, l'expert peut procéder à des ajustements manuels qui, compte tenu de sa haute qualification, peuvent influer positivement sur la qualité des prévisions.

Au total, si vous avez besoin d'améliorer la précision des prévisions d'experts dans les tâches de marketing, vous devez suivre directement les recommandations données dans l'article. Si vous êtes confronté à la tâche d'améliorer la précision des prévisions grâce à des modèles mathématiques complexes, rapides et implémentés par logiciel, vous devez alors détourner le regard, c'est-à-dire une prévision établie sur la base d'un ensemble de prévisions indépendantes. Bientôt je parlerai de prévisions consensuelles plus de détails dans ce blog.

1

Dans l'article, sur des exemples spécifiques, diverses méthodes mathématiques de prévision dans le temps sont envisagées, y compris l'extrapolation simple, les méthodes basées sur les taux de croissance et la modélisation mathématique. Il est montré que le choix de la méthode dépend de la base de prévision - informations pour la période précédente.

prévision

biostatistique

1. Afanasiev V.N., Yuzbashev M.M. Analyse et prévision des séries chronologiques : un manuel. - M. : Finances et statistiques, 2001. - 228 p.

2. Petri A., Sabin K. Statistiques visuelles en médecine. - M. : GEOTAR-MED, 2003. - 144 p.

3. Sadovnikova N.A., Shmoylova R.A. Analyse et prévision des séries chronologiques : manuel. – M. : Éd. Centre EAOI, 2001. - 67 p.

Habituellement, la prévision est comprise comme le processus de prédire l'avenir sur la base de certaines données du passé, c'est-à-dire le développement du phénomène d'intérêt dans le temps est étudié. Alors la valeur prédite est considérée comme une fonction du temps y=f(t) . Cependant, d'autres types de pronostics sont également envisagés en médecine : un diagnostic est prédit, la valeur diagnostique d'un nouveau test, une modification d'un facteur sous l'influence d'un autre, etc.

Le but de l'article était de présenter diverses méthodes de prévision et approches de leur utilisation correcte en médecine.

Matériels et méthodes de recherche

Les méthodes de prévision suivantes sont examinées dans l'article : méthodes d'extrapolation simple, méthode de la moyenne mobile, méthode de lissage exponentiel, méthode de croissance absolue moyenne, méthode du taux de croissance moyen, méthodes de prévision basées sur des modèles mathématiques.

Résultats de la recherche et discussion

Comme déjà noté, la prévision est basée sur certaines informations du passé (base de prévision). Avant de choisir une méthode de prévision, il est utile d'évaluer au moins qualitativement la dynamique de la grandeur étudiée à des moments antérieurs. Les graphiques présentés (Fig. 1) montrent qu'il peut en être autrement.

Riz. 1. Exemples de dynamique de la grandeur étudiée

Dans le premier cas (graphique A), on observe une stabilité relative avec de légères fluctuations autour de la valeur moyenne. Dans le second cas (graphe B), la dynamique est linéairement croissante, dans le troisième cas (graphe C), la dépendance au temps est non linéaire, exponentielle. Le quatrième cas (graphique D) est un exemple de fluctuations complexes à plusieurs composantes.

La méthode de prévision à court terme la plus courante (1 à 3 périodes de temps) est l'extrapolation, qui consiste à prolonger les schémas antérieurs dans le futur. L'utilisation de l'extrapolation dans les prévisions est basée sur les hypothèses suivantes :

L'évolution du phénomène étudié dans son ensemble est décrite par une courbe lisse ;

La tendance générale dans le développement du phénomène dans le passé et le présent ne subira pas de changements majeurs à l'avenir.

La première méthode des méthodes d'extrapolation simple est la méthode de la moyenne des séries. Dans cette méthode, le niveau prédit de la grandeur étudiée est pris égal à la valeur moyenne des niveaux de la série de cette grandeur dans le passé. Cette méthode est utilisée si le niveau moyen n'a pas tendance à changer, ou si ce changement est insignifiant (il n'y a pas de tendance claire, Fig. 1, graphique A)

où yprog est le niveau prédit de la valeur étudiée ; yi - valeur du i-ème niveau; n - base de prévision.

En un sens, le segment de la série chronologique couvert par l'observation peut être assimilé à un échantillon, ce qui signifie que la prévision résultante sera sélective, pour laquelle un intervalle de confiance peut être spécifié

où est l'écart type de la série chronologique ; tα -Test de Student pour un niveau de signification donné et le nombre de degrés de liberté (n-1).

Exemple. En tableau. 1 montre les données de la série temporelle y(t). Calculez la valeur prédite de y au moment t = 13 en utilisant la méthode des séries moyennes.

Tableau 1

Données chronologiques y(t)

(80+98+94+103)/4

(80+98+94+103+84)/5

(80+98+94+103+84+115)/6

(80+98+94+103+84+115+98)/7

(80+98+94+103+84+115+98+113)/8

(80+98+94+103+84+115+98+113+114)/9

(80+98+94+103+84+115+98+113+114+87)/10

(80+98+94+103+84+115+98+113+114+87+107)/11

(80+98+94+103+84+115+98+113+114+87+107+85)/12

Les séries originales et lissées sont représentées sur la Fig. 2, calcul y - dans le tableau. 2.

Riz. 2. Séries initiales et lissées

Tableau 2

Intervalle de confiance pour la prévision au temps t =13

La méthode de la moyenne mobile est une méthode de prévision à court terme basée sur la procédure de lissage des niveaux de la valeur étudiée (filtrage). On utilise principalement des filtres anti-crénelage linéaires avec un intervalle m, c'est-à-dire

.

Intervalle de confiance

où est l'écart type de la série chronologique ; tα - Test de Student pour un niveau de signification donné et le nombre de degrés de liberté (n-1).

Exemple. En tableau. 3 montre les données de la série temporelle y(t). Calculez la valeur prédite y au temps t = 13 en utilisant la méthode de la moyenne mobile avec un intervalle de lissage m = 3.

Les séries originales et lissées sont représentées sur la Fig. 3, calcul y - dans le tableau. 4.

Tableau 3

Données chronologiques y(t)

Riz. 3. Séries initiales et lissées

Tableau 4

Valeur prédictive y

La méthode de lissage exponentiel est une méthode dans laquelle les valeurs des niveaux précédents, prises avec un certain poids, sont utilisées dans le processus de nivellement de chaque niveau. Au fur et à mesure que l'on s'éloigne d'un certain niveau, le poids de cette observation diminue. La valeur lissée du niveau à l'instant t est déterminée par la formule

où St est la valeur lissée actuelle ; yt - valeur actuelle de la série originale ; St - 1 - valeur lissée précédente ; α - paramètre de lissage.

S0 est pris égal à la moyenne arithmétique des premières valeurs de la série.

Pour calculer α, la formule suivante est proposée

Il n'y a pas de consensus sur le choix de α, ce problème d'optimisation du modèle n'est pas encore résolu. Certaines publications recommandent de choisir 0,1 ≤ α ≤ 0,3.

La prévision est calculée comme suit

.

Intervalle de confiance

Tableau 5

Données chronologiques y(t)

0,3 × 80 + (1-0,3) × 90,7

0,3 × 98 + (1-0,3) × 87,5

0,3 × 94 + (1-0,3) × 90,6

0,3⋅103+(1-0,3)×91,6

0,3 × 84 + (1-0,3) × 95

0.3⋅115+(1-0.3)×91.7

0,3 × 98 + (1-0,3) × 98,7

0,3⋅113+(1-0,3)×98,5

0,3⋅114+(1-0,3) ⋅102,8

0,3×87+(1-0,3) ⋅106,2

0,3⋅107+(1-0,3) ⋅100,4

0,3×85+(1-0,3) ⋅102,4

97,2+0,3× (85-97,2)

Les séries originales et lissées sont représentées sur la Fig. 4, calcul y - dans le tableau. 6.

Riz. 4. Séries initiales et lissées

Tableau 6

Valeur prévue y au temps t =11

La méthode de prévision suivante est la méthode de la croissance absolue moyenne : le niveau prévu de la quantité étudiée évolue en fonction de la croissance absolue moyenne de cette quantité dans le passé. Cette méthode est appliquée si la tendance générale de la dynamique est linéaire (pour le cas illustré à la Fig. 1, graphique B)

où ; y0 - le niveau d'extrapolation de base est sélectionné comme la moyenne des dernières valeurs de la série d'origine ; - augmentation absolue moyenne des niveaux de la série ; l est le nombre d'intervalles de prévision.

La valeur moyenne des dernières valeurs de la série, maximum trois, est prise comme niveau de base.

Tableau 7

Données chronologiques y(t)

Prévision = y0+Δl

(60+75+70)/3=68,3

(75+70+103)/3=82,7

(70+103+100)/3=91

(103+100+115)/3=106

(100+115+125)/3=113,3

(115+125+113)/3=117,7

(125+113+138)/3=125,3

(113+138+136)/3=129

(138+136+145)/3=139,7

(136+145+150)/3=143,7

143,7+8,2⋅1=151,9

143,7+8,2⋅2=160,1

143,7+8,2⋅3=168,3

Les séries originales et lissées sont représentées sur la Fig. 5.

Riz. 5. Séries initiales et lissées

Méthode du taux de croissance moyen

Le niveau prédit de la quantité étudiée évolue en fonction du taux de croissance moyen de cette quantité dans le passé. Cette méthode est utilisée si la tendance globale de la dynamique est caractérisée par une courbe exponentielle ou exponentielle (Fig. 1B)

où est le taux de croissance moyen dans le passé ; l est le nombre d'intervalles de prédiction.

L'estimation prédictive dépendra de la direction dans laquelle le niveau de base y0 s'écarte de la tendance principale (tendance), il est donc recommandé de calculer y0 comme une valeur moyenne des dernières valeurs de la série.

Tableau 8

Données chronologiques y(t)

62,5⋅1,081 = 67,7

(70/60)1/2 =1,08

65⋅1,081 = 70,2

(65+70+68)/3=67,7

(68/60)1/3 =1,04

67,7⋅1,041 =70,5

(70+68+82)/3=73,3

(82/60)1/4 =1,08

73,3⋅1,081 =79,3

(68+82+80)/3=76,7

(80/60)1/5 =1,06

76,7⋅1,061 =81,2

(82+80+95)/3=85,7

(95/60)1/6 =1,08

85,7⋅1,081 =92,5

(80+95+113)/3=96

(113/60)1/7 =1,09

96⋅1,091 =105,1

(95+113+135)/3=114,3

(135/60)1/8 =1,11

114,3⋅1,111 =126,5

(113+135+140)/3=129,3

(140/60)1/9 =1,10

129,3⋅1,11 =142,1

(135+140+168)/3=147,7

(168/60)1/10 =1,11

147,7⋅1,111 =163,7

(140+168205)/3=171

(205/60)1/11 =1,12

171⋅1,121 =191,2

171⋅1,122 =213,8

171⋅1,123 =239,1

Les séries originales et lissées sont représentées sur la Fig. 6.

Riz. 6. Séries initiales et lissées

À ce jour, la méthode de prévision la plus courante consiste à trouver une expression analytique (équation) de la tendance. La tendance du phénomène extrapolé est la tendance principale de la série chronologique, dans une certaine mesure exempte d'influences aléatoires.

L'élaboration de la prévision consiste à déterminer le type de fonction d'extrapolation y=f(t), qui exprime la dépendance de la valeur étudiée au temps à partir des données observées initiales. La première étape consiste à choisir le type optimal de fonction qui donne la meilleure description de la tendance. Les dépendances les plus couramment utilisées sont :

Linéaire ;

Parabolique ;

Fonction exponentielle ;

Les problèmes de recherche des coefficients d'une fonction linéaire et de la prévision basée sur celle-ci sont examinés dans la section statistique "analyse de régression". Si la forme de la courbe décrivant la tendance n'est pas linéaire, alors la tâche d'estimer la fonction y=f(t) devient plus compliquée, et dans ce cas il est nécessaire d'impliquer des biostatisticiens dans l'analyse et d'utiliser des programmes informatiques pour les statistiques. traitement de l'information.

Dans la plupart des cas réels, la série chronologique est une courbe complexe qui peut être représentée comme la somme ou le produit des composantes tendance, saisonnière, cyclique et aléatoire.

La tendance est un changement progressif du processus au fil du temps et est due à l'action de facteurs à long terme. L'effet saisonnier est associé à la présence de facteurs qui agissent avec une périodicité prédéterminée (par exemple, les saisons, les cycles lunaires). La composante cyclique décrit de longues périodes de hausse et de baisse relatives et consiste en des cycles de durée et d'amplitude variables (par exemple, certaines épidémies sont de nature cyclique longue). La composante aléatoire de la série reflète l'impact de nombreux facteurs aléatoires et peut avoir une structure variée.

Conclusion

Les méthodes d'extrapolation simple, la méthode des moyennes mobiles, la méthode de lissage exponentiel sont les plus simples et en même temps les plus approximatives - cela ressort des larges intervalles de confiance dans les exemples donnés. Une grande erreur de prévision est observée dans le cas de fortes fluctuations de niveau. Il convient de noter qu'il est illégal d'utiliser ces méthodes s'il existe une nette tendance à la hausse (ou à la baisse) dans la série chronologique initiale. Néanmoins, pour les prévisions à court terme, leur utilisation est justifiée.

L'analyse de toutes les composantes de la série chronologique et la prévision basée sur celles-ci n'est pas une tâche triviale, elle est considérée dans la section statistique "analyse des séries chronologiques" et nécessite une formation spéciale.

Lien bibliographique

Koichubekov B.K., Sorokina M.A., Mkhitaryan K.E. MÉTHODES MATHÉMATIQUES DE PRÉDICTION EN MÉDECINE // Succès des sciences naturelles modernes. - 2014. - N° 4. - P. 29-36 ;
URL : http://natural-sciences.ru/ru/article/view?id=33316 (date d'accès : 30/03/2019). Nous portons à votre connaissance les magazines publiés par la maison d'édition "Academy of Natural History" le 23 avril 2013 à 11h08

Classification des méthodes et modèles de prévision

  • Mathématiques
  • Didacticiel

Je fais des prévisions de séries chronologiques depuis plus de 5 ans. L'année dernière, j'ai soutenu ma thèse sur le thème " Modèle de prévision de séries chronologiques à partir d'un échantillon de similarité maximale”, cependant, après la soutenance, il restait pas mal de questions. Voici l'un d'entre eux - classification générale des méthodes et modèles de prévision.


Habituellement, dans les œuvres des auteurs nationaux et anglophones, ils ne se posent pas la question de la classification des méthodes et des modèles de prévision, mais se contentent de les répertorier. Mais il me semble qu'aujourd'hui ce domaine s'est tellement développé et élargi que, même si le classement le plus général s'impose. Vous trouverez ci-dessous ma propre version du classement général.

Quelle est la différence entre une méthode de prévision et un modèle ?

Méthode de prédiction représente une séquence d'actions qui doivent être effectuées pour obtenir un modèle de prévision. Par analogie avec la cuisine, une méthode est une séquence d'actions selon laquelle un plat est préparé - c'est-à-dire qu'une prévision est faite.


Modèle de prédiction est une représentation fonctionnelle qui décrit adéquatement le processus à l'étude et sert de base à l'obtention de ses valeurs futures. Dans la même analogie culinaire, le modèle a une liste d'ingrédients et leur rapport, ce qui est nécessaire pour notre plat - une prévision.


L'association de la méthode et du modèle forme une recette complète !



Il est maintenant courant d'utiliser des abréviations anglaises pour les noms des modèles et des méthodes. Par exemple, il y a le célèbre modèle de prévision ARIMAX (autoregression Integrated Moving Average Extended). Ce modèle et sa méthode correspondante sont généralement appelés ARIMAX, et parfois le modèle Box-Jenkins (méthode) d'après les auteurs.

On classe d'abord les méthodes

Si vous regardez attentivement, il devient vite clair que le concept de " méthode de prévision"concept beaucoup plus large" modèle prédictif". À cet égard, au premier stade de la classification, les méthodes sont généralement divisées en deux groupes : intuitives et formalisées.



Si nous rappelons notre analogie culinaire, alors même là, nous pouvons diviser toutes les recettes en recettes formalisées, c'est-à-dire écrites par le nombre d'ingrédients et la méthode de préparation, et intuitives, c'est-à-dire non enregistrées nulle part et obtenues à partir de l'expérience de le spécialiste culinaire. Quand n'utilisons-nous pas une ordonnance? Quand le plat est très simple : faire frire des pommes de terre ou faire bouillir des boulettes, on n'a pas besoin de recette. Quand n'utilisons-nous pas la recette ? Quand on veut inventer quelque chose de nouveau !


Méthodes de prévision intuitives traiter les jugements et les appréciations des experts. À ce jour, ils sont souvent utilisés en marketing, en économie, en politique, car le système, dont le comportement doit être prédit, est soit très complexe et ne peut être décrit mathématiquement, soit très simple et n'a pas besoin d'une telle description. Vous trouverez des détails sur ces méthodes dans .


Méthodes formalisées- les méthodes de prévision décrites dans la littérature, à la suite desquelles des modèles de prévision sont construits, c'est-à-dire qu'elles déterminent une telle dépendance mathématique qui vous permet de calculer la valeur future du processus, c'est-à-dire de faire une prévision.


Sur ce point, la classification générale des méthodes de prévision peut, à mon avis, être complétée.

Ensuite, nous faisons une classification générale des modèles

Ici, il est nécessaire de procéder à la classification des modèles de prévision. À la première étape, les modèles doivent être divisés en deux groupes : les modèles de domaine et les modèles de série chronologique.




Modèles de domaine- de tels modèles mathématiques de prévision, pour la construction desquels les lois du domaine sont utilisées. Par exemple, un modèle utilisé pour faire une prévision météorologique contient les équations de la dynamique des fluides et de la thermodynamique. La prévision de l'évolution de la population est faite sur un modèle construit sur une équation différentielle. La prédiction du taux de sucre dans le sang d'une personne atteinte de diabète se fait sur la base d'un système d'équations différentielles. En bref, ces modèles utilisent des dépendances spécifiques à un domaine particulier. Ces modèles se caractérisent par une approche individuelle du développement.


Modèles de séries chronologiques- des modèles mathématiques de prévision qui cherchent à trouver la dépendance de la valeur future par rapport au passé dans le processus lui-même et calculent la prévision sur cette dépendance. Ces modèles sont universels pour divers domaines, c'est-à-dire que leur forme générale ne change pas selon la nature de la série chronologique. Nous pouvons utiliser des réseaux de neurones pour prédire la température de l'air, puis appliquer un modèle similaire sur des réseaux de neurones pour prédire les indices boursiers. Ce sont des modèles généralisés, comme l'eau bouillante, dans laquelle si vous jetez un produit, il bouillira, quelle que soit sa nature.

Classification des modèles de séries chronologiques

Il me semble qu'il n'est pas possible de faire une classification générale des modèles de domaines : que de domaines, que de modèles ! Cependant, les modèles de séries chronologiques se prêtent facilement à une division simple. Les modèles de séries chronologiques peuvent être divisés en deux groupes : statistiques et structurels.




À modèles statistiques la dépendance de la valeur future par rapport au passé est donnée sous la forme d'une équation. Ceux-ci inclus:

  1. modèles de régression (régression linéaire, régression non linéaire);
  2. modèles autorégressifs (ARIMAX, GARCH, ARDLM) ;
  3. modèle de lissage exponentiel ;
  4. modèle basé sur l'échantillon de similarité maximale ;
  5. etc.

À modèles structurels la dépendance de la valeur future vis-à-vis du passé est donnée sous la forme d'une certaine structure et de règles pour se déplacer le long de celle-ci. Ceux-ci inclus:

  1. modèles de réseaux neuronaux ;
  2. modèles basés sur les chaînes de Markov ;
  3. des modèles basés sur des arbres de classification-régression ;
  4. etc.

Pour les deux groupes, j'ai indiqué les modèles de prévision principaux, c'est-à-dire les plus courants et les plus détaillés. Cependant, il existe déjà aujourd'hui un grand nombre de modèles de prévision de séries chronologiques, et pour faire des prévisions, par exemple, des modèles SVM (support vector machine), des modèles GA (algorithme génétique) et bien d'autres ont commencé à être utilisés.

Classification générale

Ainsi nous avons obtenu ce qui suit classification des modèles et des méthodes de prévision.




  1. Tikhonov E.E. Prévision dans les conditions du marché. Nevinnomyssk, 2006. 221 p.
  2. Armstrong J.S. Prévisions pour le marketing // Méthodes quantitatives en marketing. Londres : International Thompson Business Press, 1999, p. 92–119.
  3. Jingfei Yang M. Sc. Prévision de la charge à court terme du système électrique : thèse de doctorat. Allemagne, Darmstadt, Elektrotechnik und Informationstechnik der Technischen Universitat, 2006. 139 p.
UPD. 15/11/2016.
Messieurs, ça a atteint la folie ! Récemment, on m'a envoyé un article pour l'édition VAK avec un lien vers cette entrée pour examen. J'attire votre attention sur le fait que ni dans les diplômes, ni dans les articles, et encore moins dans les mémoires impossible de créer un lien vers le blog! Si tu veux un lien utilise celui-ci : Chuchueva I.A. MODÈLE DE PRÉDICTION DE SÉRIES TEMPORELLES SUR LA SÉLECTION DE LA SIMILARITÉ MAXIMALE, mémoire… cand. ceux. Sciences / Université technique d'État de Moscou. N.E. Bauman. Moscou, 2012.

Annexe 1. MÉTHODES D'ANALYSE STATISTIQUE ET DE PRÉVISION EN ENTREPRISE

4. Outils mathématiques de prévision

Les méthodes et modèles mathématiques utilisés dans les problèmes d'analyse et de prévision stochastiques en entreprise peuvent être liés à diverses branches des mathématiques : analyse de régression, analyse de séries chronologiques, formation et évaluation d'opinions d'experts, modélisation par simulation, systèmes d'équations simultanées, analyse discriminante, analyse logit et les modèles probit, l'appareil des fonctions de décision logiques, l'analyse de la variance ou de la covariance, l'analyse des corrélations de rang et des tableaux de contingence, etc. Cependant, tous sont unis par le fait qu'ils représentent différentes approches pour résoudre le problème central de l'analyse statistique multivariée et économétrie - problèmes d'étude statistique des dépendances, qui est juste problème de base de l'analyse statistique et de la prévision en entreprise (sa formulation générale a été donnée au paragraphe 2).

Au paragraphe 1, il a déjà été noté que parmi p+k+l+m Les composants de la caractéristique multidimensionnelle analysée peuvent être à la fois des variables quantitatives et des variables ordinales et nominales. Les approches mentionnées ci-dessus pour résoudre le problème central de l'analyse statistique multivariée ont été formées en tenant compte de la nature des variables étudiées. La spécialisation correspondante de ces approches est reflétée dans le tableau. 4. Il contient également des références à des sources littéraires, dans lesquelles on peut trouver une description assez complète de ces approches.

Tableau 4

La nature des indicateurs qui en résultent

La nature des variables explicatives

Le nom des sections de service de l'analyse statistique multivariée

Sources littéraires

quantitatif

quantitatif

Analyse de régression et systèmes d'équations simultanées

quantitatif

La seule variable quantitative interprétée comme "temps"

Analyse des séries chronologiques

quantitatif

Non quantitatif (variables ordinales ou nominales)

Analyse de variance

quantitatif

Analyse de covariance, modèles de régression typologique

Non quantitatif (variables ordinales)

Non quantitatif (variables ordinales et nominales)

Analyse des corrélations de rang et tableaux de contingence

Non quantitatif (variables nominales)

quantitatif

Analyse discriminante, modèles logit et probit, analyse typologique, taxonomie, découpage de mélanges de distributions

Mixte (variables quantitatives et non quantitatives)

Mixte (variables quantitatives et non quantitatives)

Appareil de fonctions logiques de décision, Data Mining

Néanmoins, la pratique de l'analyse statistique et de la prévision en entreprise montre que dans tout le spectre de leurs outils mathématiques, le leadership incontesté (en termes de prévalence et de pertinence) appartient à trois sections :
- analyse de régression;
-
Analyse des séries chronologiques;
-
le mécanisme de formation et d'analyse statistique des expertises.

Examinons brièvement chacune de ces sections.

Analyse de régression

Comme précédemment, nous décrirons le fonctionnement de l'objet réel étudié (firme, entreprise, processus de production ou de distribution des produits, etc.) par un ensemble de variables et (leur sens significatif est décrit au paragraphe 2). Introduisons un certain nombre de définitions et de concepts utilisés dans l'analyse de régression.

Variables résultantes (dépendantes, endogènes). La variable qui caractérise le résultat ou l'efficacité du système analysé est appelée résultante (dépendante, endogène). Ses valeurs se forment pendant et dans le fonctionnement de ce système sous l'influence d'un certain nombre d'autres variables et facteurs, dont certains peuvent être enregistrés et, dans une certaine mesure, gérés et planifiés (cette partie est communément appelée variables explicatives , voir ci-dessous). Dans l'analyse de régression, la variable résultante agit comme une fonction dont les valeurs sont déterminées (mais avec une erreur aléatoire) par les valeurs des variables explicatives susmentionnées qui agissent comme arguments. Par conséquent, de par sa nature, la variable résultante est toujours stochastique (aléatoire). Dans le cas général, le comportement de plusieurs variables résultantes est généralement analysé .

Variables explicatives (prédictives, exogènes) . Les variables (ou signes) pouvant être enregistrées, décrivant les conditions de fonctionnement du système économique réel étudié et déterminant dans une large mesure le processus de formation des valeurs des variables résultantes, sont appelées explicatives. En règle générale, certains d'entre eux se prêtent à une réglementation et à une gestion au moins partielles. Les valeurs d'un certain nombre de variables explicatives peuvent être définies comme "en dehors" du système analysé. Dans ce cas, ils sont dits exogènes. Dans l'analyse de régression, ils jouent le rôle d'arguments de la fonction, qui est considérée comme l'indicateur résultant analysé. De par leur nature, les variables explicatives peuvent être aléatoires ou non aléatoires.

Résidus de régression- il s'agit de composants aléatoires latents (c'est-à-dire cachés, ne se prêtant pas à une mesure directe), reflétant l'impact, respectivement, sur non pris en compte dans la composition des facteurs, ainsi que des erreurs aléatoires dans la mesure des variables résultantes analysées. D'une manière générale, ils peuvent aussi dépendre de , c'est-à-dire dans le cas général .

Le schéma général de l'interaction des variables dans l'analyse de régression est illustré dans la figure.




Image . Schéma général d'interaction des variables dans l'analyse de régression.

fonction de régression sur. La fonction s'appelle fonction de régression par (ou juste - régression sur) s'il décrit l'évolution de la valeur moyenne conditionnelle de la variable résultante (en supposant que les valeurs des variables explicatives sont fixées à des niveaux ) en fonction de l'évolution des valeurs des variables explicatives. En conséquence, mathématiquement, cette définition peut être écrite comme

où le symbole signifie l'opération de calcul de la moyenne théorique des valeurs (c'est-à-dire est l'espérance mathématique de la variable aléatoire , et , ou est simplement l'espérance mathématique conditionnelle de la variable aléatoire , calculée à la condition que les valeurs de l'explication les variables sont fixées au niveau ).

Si nous analysons simultanément les variables résultantes , alors nous devrions considérer respectivement les fonctions de régression ou, ce qui revient au même, une à valeur vectorielle une fonction

. (11)

Alors le modèle de régression peut s'écrire sous la forme

, (12)

de plus, il découle de la définition que toujours]

(12’)

(identique le signe égal dans (12') signifie qu'il est valable pour quelconque valeurs ; le vecteur colonne de zéros sur le côté droit a une dimension ).

problème de régression sous sa forme la plus générale peut être formulé comme suit :

selon les résultats des mesures

des variables étudiées sur les objets (systèmes, processus) de la population analysée, construire une telle fonction (vectorielle) (11) qui permettrait de restituer au mieux (dans un certain sens) les valeurs des variables résultantes (prédites) par des valeurs données de variables explicatives (exogènes) .

Remarque 1. Les plus courants sont linéaire des modèles de régression, c'est-à-dire des modèles dans lesquels les fonctions de régression ont une forme linéaire :

Remarque 2. Il existe au moins deux options pour interpréter les variables « comportementales », « statut » et « externes » introduites dans la section 2, respectivement, et dans le cadre du modèle de régression décrit (12)–(12 '). Dans la première variante les trois types variables et se référer à des variables explicatives et construire une régression sur . Dans une autre variante, les variables et sont interprétées comme conditions d'observation et puis séparément pour chaque combinaison fixe de ces conditions, un modèle de régression de la forme (12) est construit (dans le cadre d'un modèle linéaire (12''), cela signifiera que les coefficients de régression eux-mêmes dépendent de et , c'est-à-dire qu'ils sont définis comme des fonctions de et ).

Analyse des séries chronologiques

Toute analyse statistique et prévision est basée sur les données statistiques initiales. Leurs principaux types ont été présentés au paragraphe 1. Dans le même temps, si le processus d'enregistrement des données se déroule dans le temps et que le temps lui-même est fixé avec les valeurs des caractéristiques analysées , on parle alors d'une analyse statistique du soi-disant données du panneau. Si nous fixons le numéro de la variable et le numéro de l'objet examiné statistiquement , alors la séquence de valeurs situées dans l'ordre chronologique

appelé série chronologique unidimensionnelle. Si, cependant, nous considérons simultanément des séries temporelles unidimensionnelles de la forme (13), c'est-à-dire, étudions les modèles dans interconnecté comportement des séries temporelles (13) pour , caractérisant la dynamique des variables, mesuré sur quelqu'un(-m) objet, puis ils parlent de analyses statistiques séries chronologiques multivariées. Essentiellement, toutes les tâches liées à l'analyse de la dynamique économique et à la prévision impliquent l'utilisation de séries chronologiques de certains indicateurs comme base statistique.

En règle générale, dans les tâches de prévision d'activité, seuls discret (par temps d'observation) séries chronologiques unidimensionnelles pour moments d'observation équidistants, c'est-à-dire où est une période donnée (minute, heure, jour, semaine, mois, trimestre, année, etc.). Dans ces cas, il nous sera plus commode de représenter la série chronologique étudiée sous la forme

où est la valeur de l'indicateur analysé, enregistrée au ième pas de temps .

Parlant de l'utilisation de l'appareil d'analyse des séries chronologiques dans le problème de la prévision, nous entendons brièvement- et moyen terme prévoir, parce que la construction long terme prévision implique l'utilisation obligatoire de méthodes d'organisation et d'analyse statistique expertises particulières.

Genèse des observations formant la série chronologique. Nous parlons de la structure et de la classification des principaux facteurs, sous l'influence desquels se forment les valeurs des éléments de la série chronologique. Il est conseillé de distinguer les 4 types suivants de tels facteurs.

(MAIS) long terme, formant une tendance générale (à long terme) dans le changement du trait analysé. Habituellement, cette tendance est décrite à l'aide de l'une ou l'autre fonction non aléatoire F tr (t), généralement monotone. Cette fonction s'appelle fonction de tendance ou simplement tendance.

(B) Saisonnier, qui forment des fluctuations du trait analysé se répétant périodiquement à une certaine période de l'année. Convenons de noter le résultat de l'action des facteurs saisonniers à l'aide d'une fonction non aléatoire . Étant donné que cette fonction doit être périodique(avec des périodes multiples de saisons, c'est-à-dire des trimestres), des harmoniques (fonctions trigonométriques) participent à son expression analytique, dont la fréquence est généralement déterminée par le contenu du problème.

(À) Cyclique (opportuniste) qui forment des changements dans le trait analysé, dus à l'action de cycles à long terme de nature économique, démographique ou astrophysique (ondes de Kondratiev, "trous" démographiques, cycles d'activité solaire, etc.). Le résultat de l'action des facteurs cycliques sera désigné par une fonction non aléatoire .

(G) Aléatoire(irrégulier), ne se prête pas à la comptabilité et à l'enregistrement. Leur impact sur la formation des valeurs de la série temporelle détermine juste caractère stochastiqueéléments, et donc le besoin d'interprétation en tant qu'observations faites sur des variables aléatoires, respectivement. On notera le résultat de l'impact des facteurs aléatoires à l'aide de variables aléatoires ("résidus", "erreurs"). Bien sûr, il n'est pas du tout nécessaire que des facteurs participent simultanément au processus de formation des valeurs de toute série chronologique. tout quatre types. Dans certains cas, les valeurs de la série chronologique peuvent être formées sous l'influence des facteurs (A), (B) et (D), dans d'autres - sous l'influence des facteurs (A), (C) et (D ) et, enfin, exclusivement sous l'influence des seuls facteurs aléatoires (D). Cependant, dans tous les cas l'indispensable participation du hasard (évolutionniste) facteurs (D). De plus, il est généralement admis (comme hypothèse) structurel additif schème l'influence des facteurs (A), (B), (C) et (D) sur la formation des valeurs, c'est-à-dire la légitimité de représenter les valeurs des membres de la série temporelle sous forme de décomposition :

Les conclusions quant à savoir si des facteurs de ce type sont impliqués ou non dans la formation des valeurs peuvent être basées à la fois sur l'analyse de l'essence du contenu de la tâche (c'est-à-dire être a priori expert de la nature), et sur une spéciale analyse statistique des séries temporelles étudiées.

Dans le cadre des concepts et notations introduits problème d'analyse statistique de séries chronologiques en général peut se formuler comme suit :

à partir des résultats des mesures de la variable étudiée pour les pas de temps de la période de base, construire les meilleures estimations (dans un certain sens) des termes d'expansion (14).

La solution de ce problème est utilisée pour construire une valeur prédictive pour les incréments de temps à l'aide de la formule (14) avec et lors de la substitution des estimations obtenues des composants du côté droit de la décomposition en elle.

Mécanismes de formation et analyse statistique des expertises

Habituellement, on distingue les principaux types suivants d'organisation des travaux d'un groupe d'experts () :

· collégial: « méthode des commissions » (sous la forme d'une discussion ouverte sur le problème en discussion) ; "méthode judiciaire" (sous forme de confrontation entre "défense" et "accusation" pour chacune des options de la solution discutée au problème); "remue-méninges", etc. ;

· partiellement collégial : analyse de scénarios de type "what-if", la méthode "Delphi" - une discussion en plusieurs tours du problème avec un vote secret des experts ou le remplissage de questionnaires anonymes spéciaux à la fin de chaque tour et le travail d'un groupe d'analyse indépendant entre les rondes, etc. ;

· individuellement autonome : chacun des membres du groupe d'experts forme et exprime son opinion (indépendamment des positions des autres participants) sous la forme d'un classement des solutions (ou objets) discutés, de leurs comparaisons par paires ou de l'attribution de chacun d'eux à l'une des gradations décrites précédemment (voir formulaires de présentation des données statistiques initiales sous forme de tableaux de fréquences ou de tableaux de contingence entre les avis des -ème et -ème experts est mesuré par la valeur , où est le coefficient de corrélation de rang de Spearman (voir, Ch. 11]) .. on peut alors résoudre le problème du "clustering" d'experts, en interprétant chacun des clusters ainsi trouvés comme un groupe d'experts partageant les mêmes idées.

(ii) Analyse de l'accord mutuel des avis du groupe d'experts. Disposant de l'avis de tout un groupe d'experts, le statisticien cherche à apprécier le degré de cohérence de toutes ces expertises, y compris en testant statistiquement l'hypothèse d'absence totale de cohérence (et alors, évidemment, il faut soit préciser la formulation de le problème proposé par les experts, ou modifier la composition du groupe d'experts). Ce problème est également résolu au moyen d'une analyse statistique multivariée. Le choix d'une méthode spécifique dépend de la forme des données statistiques initiales. Par exemple, si les opinions des experts sont représentées par des classements, alors comme mesure de leur cohérence, on peut considérer coefficient d'objets), c'est-à-dire avec des données statistiques initiales de la forme est défini comme une solution à un problème d'optimisation de la forme j Plus l'expert est éloigné de l'opinion unifiée du groupe, plus le niveau de sa compétence relative est estimé faible. A noter que si, à la suite de l'étude de la structure de l'ensemble des avis d'experts, le statisticien arrive à la conclusion que plusieurs sous-groupes d'experts avec une homogénéité d'opinions au sein de chaque sous-groupe et avec une différence significative d'opinions dans n'importe quelle paire de ces sous-groupes, la tâche d'une opinion de groupe unique et d'une évaluation de la compétence relative d'un expert est résolue séparément pour chacun des sous-groupes identifiés.


Les facteurs aléatoires, à leur tour, peuvent être de double nature : soudain(« désordre »), entraînant des changements structurels brusques dans le mécanisme de formation des valeurs x(t)(ce qui s'exprime, par exemple, par des modifications spasmodiques radicales des caractéristiques structurelles de base des fonctions F tr(t), j(t) et y(t) séries chronologiques analysées à un moment aléatoire), et résidu évolutif, provoquant des écarts aléatoires relativement faibles des valeurs x(t) de ceux qui auraient dû être sous l'influence de facteurs (A), (B) et (C). Cependant, dans cette section, les schémas de formation de séries chronologiques seront considérés, y compris l'action seulement évolutif facteurs aléatoires résiduels.

Précédent
Chargement...Chargement...