Metodi matematici di previsione. Successi delle moderne scienze naturali

Metodi economici e matematici. Quando si utilizzano metodi economici e matematici, la struttura dei modelli viene stabilita e verificata sperimentalmente, in condizioni che consentono l'osservazione e la misurazione oggettiva.

La determinazione del sistema di fattori e della struttura causa-effetto del fenomeno oggetto di studio è la fase iniziale della modellizzazione matematica.

I metodi statistici occupano un posto speciale nelle previsioni. I metodi della statistica matematica e applicata sono utilizzati nella pianificazione di qualsiasi lavoro di previsione, nell'elaborazione di dati ottenuti sia con metodi intuitivi, sia utilizzando metodi economici e matematici propri. In particolare, vengono utilizzati per determinare il numero di gruppi di esperti, cittadini intervistati, la frequenza di raccolta dei dati e valutare i parametri di modelli economici e matematici teorici.

Ciascuno di questi metodi presenta vantaggi e svantaggi. Tutti i metodi di previsione si completano a vicenda e possono essere utilizzati insieme.

Metodo dello scenario- uno strumento efficace per organizzare le previsioni, combinando approcci qualitativi e quantitativi.

Uno scenario è un modello del futuro, che descrive il possibile corso degli eventi, indicando le probabilità della loro attuazione. Lo scenario individua i principali fattori di cui tenere conto e indica come questi fattori possano influenzare gli eventi attesi. Di norma, vengono compilati diversi scenari alternativi. Uno scenario è quindi una caratterizzazione del futuro in una previsione esplorativa, non una definizione di uno stato futuro possibile o desiderato. Solitamente viene considerata come quella di base la variante più probabile dello scenario, sulla base della quale si prendono le decisioni. Altre versioni dello scenario, ritenute alternative, sono previste nel caso in cui la realtà cominci ad avvicinarsi maggiormente al loro contenuto, e non alla versione base dello scenario. Gli scenari sono generalmente descrizioni di eventi e stime di indicatori e caratteristiche nel tempo. Il metodo di preparazione dello scenario è stato inizialmente utilizzato per identificare i possibili esiti delle operazioni militari. Successivamente, la previsione di scenario iniziò ad essere utilizzata nella politica economica e poi nella pianificazione strategica aziendale. Ora è il meccanismo di integrazione più noto per la previsione dei processi economici nel mercato. Gli script sono un mezzo efficace per superare il pensiero tradizionale. Uno scenario è un'analisi di un presente e di un futuro in rapida evoluzione e la sua preparazione costringe a trattare dettagli e processi che potrebbero non essere rilevati quando si utilizzano metodi di previsione particolari in isolamento. Pertanto, lo scenario differisce da una semplice previsione. Si tratta di uno strumento che consente di determinare le tipologie di previsioni che dovrebbero essere sviluppate per descrivere il futuro con sufficiente completezza, tenendo conto di tutti i fattori principali.


L'utilizzo della previsione di scenario a condizioni di mercato fornisce:

migliore comprensione della situazione, della sua evoluzione;

valutazione di potenziali minacce;

identificare le opportunità;

individuazione di possibili ed opportuni indirizzi di attività;

aumentare il livello di adattamento ai cambiamenti dell'ambiente esterno.

La previsione dello scenario è un mezzo efficace per preparare le decisioni pianificate sia all'interno di un'impresa che negli stati.

La pianificazione è strettamente correlata alla previsione, questi processi sono divisi in una certa misura in modo condizionale, pertanto gli stessi metodi o metodi strettamente correlati possono essere utilizzati nella pianificazione e nella previsione.

Decisioni di approvazione del piano. I piani sono il risultato di decisioni gestionali che vengono prese sulla base di possibili alternative di pianificazione. Le decisioni di gestione sono prese secondo determinati criteri. Utilizzando questi criteri, le alternative vengono valutate in termini di raggiungimento di uno o più obiettivi. I criteri riflettono gli obiettivi fissati dai decisori.

Una decisione basata su un unico criterio è considerata semplice e una decisione basata su più criteri è considerata complessa. I criteri in cui sono formulate le scale di rating quantitative o ordinali consentono di utilizzare metodi matematici di ricerca operativa per elaborare soluzioni.

Le decisioni di approvazione del piano tendono non solo a essere complesse a causa di molteplici criteri, ma anche difficili a causa dell'incertezza, delle informazioni limitate e dell'elevata responsabilità. Pertanto, le decisioni finali sull'approvazione dei piani vengono prese mediante selezione euristica e intuitiva da un numero limitato di alternative pre-preparate.

I metodi di pianificazione sono quindi metodi per preparare alternative di pianificazione, o almeno un'opzione di piano, per l'approvazione da parte di un decisore o organo.

I metodi per preparare una o più varianti di piani si distinguono per i metodi utilizzati per elaborare questi piani, metodi e termini per l'eventuale attuazione di piani, oggetti di pianificazione.

Come la previsione, la pianificazione può essere basata su metodi euristici e matematici. Tra i metodi matematici della ricerca operativa, i metodi di pianificazione ottimale occupano un posto speciale.

Metodi di pianificazione ottimale. Nel risolvere i problemi di preparazione dell'ottimo, cioè il migliore secondo determinati criteri, si possono utilizzare piani, metodi di programmazione matematica.

I compiti della programmazione matematica sono trovare il massimo o il minimo di una determinata funzione in presenza di restrizioni sulle variabili, gli elementi della soluzione. Sono noti numerosi problemi tipici della programmazione matematica, per la cui soluzione sono stati sviluppati metodi, algoritmi e programmi efficaci per computer, ad esempio:

Compiti sulla composizione della miscela, che consistono nel determinare una dieta che abbia un costo minimo e sia composta da diversi prodotti con diverso contenuto di nutrienti, a seconda della condizione di garantire che il loro contenuto nella dieta non sia inferiore a un certo livello;

Compiti sul piano di produzione ottimale, che consistono nel determinare il miglior piano per la produzione di beni in termini di volume di vendita o profitto con risorse o capacità produttive limitate;

Compiti di trasporto, la cui essenza è la scelta di un piano di trasporto che fornisca un minimo di costi di trasporto quando si soddisfano determinati volumi di consegne ai consumatori in punti diversi, con percorsi possibili diversi, da punti diversi in cui le scorte o le capacità di produzione sono limitate.

I metodi della teoria dei giochi possono essere utilizzati per pianificare condizioni meteorologiche incerte, i tempi previsti per i disastri naturali. Questi sono "giochi" con un "giocatore" passivo che agisce indipendentemente dai tuoi piani.

Sono stati anche sviluppati metodi per risolvere problemi di teoria dei giochi con "giocatori" attivi che agiscono in risposta alle azioni della parte opposta. Inoltre, sono stati sviluppati metodi per risolvere problemi in cui le azioni delle parti sono caratterizzate da determinate strategie - serie di regole di azione. Queste decisioni possono essere utili quando si elaborano piani di fronte alla possibile opposizione dei concorrenti, alla diversità nelle azioni dei partner.

Le soluzioni ai problemi di teoria dei giochi possono dipendere dal livello di rischio che si è disposti ad accettare o basarsi semplicemente sull'ottenimento del massimo beneficio garantito. La risoluzione di alcuni tipi di semplici problemi di teoria dei giochi si riduce alla risoluzione di problemi di programmazione lineare.

Materiali più dettagliati e corretti sono stati pubblicati su .

Nel marzo 2011 è stata pubblicata la nota "Cinque modi per migliorare l'accuratezza delle previsioni". L'autore Aleksey Skripchan ha considerato in modo molto efficiente, semplice e sufficientemente dettagliato le previsioni che devono essere eseguite come parte del marketing e della pianificazione. Il suo epiteto suona interessante nella sottosezione "I vantaggi di una migliore previsione":

Le previsioni diventano il timone che aiuta un'azienda a mantenere la rotta, cambiare direzione o navigare in acque sconosciute con sicurezza...

Vorrei aggiungere alcune parole a quanto già detto. Principalmente, va notato che nell'articolo citato si parla di previsioni di esperti. Necessità di distinguere due tipi di previsione: esperta e formalizzata.

Previsioni esperte

La previsione esperta implica la formazione di valori futuri da parte di un esperto, ad es. una persona con una profonda conoscenza in una determinata area. In questo caso, l'esperto usa spesso l'apparato matematico, tuttavia, in questo tipo di previsione, l'apparato matematico è solo uno strumento computazionale ausiliario. La base è la conoscenza e l'intuizione di un esperto, e quindi a volte queste i metodi sono detti intuitivi.

La previsione esperta viene utilizzata quando l'oggetto di previsione è troppo semplice o, al contrario, così complesso da rendere impossibile prendere in considerazione analiticamente l'influenza di fattori esterni.. I metodi di previsione degli esperti non comportano lo sviluppo di modelli previsionali e riflettono i giudizi individuali degli specialisti (esperti) in merito alle prospettive di sviluppo del processo. Questi metodi includono i seguenti metodi.

  • Metodo di valutazione degli esperti
  • Metodo delle analogie storiche
  • Preveggenza per modello
  • logica sfocata
  • Modellazione di scenari "e se"

La previsione formalizzata è una previsione basata su modello matematico, che, catturando gli schemi del processo, alla sua uscita ha i valori futuri del processo allo studio. parecchio, ad esempio, secondo una serie di recensioni, ci sono attualmente oltre 100 classi di modelli di previsione. Il numero di classi generali di modelli che si ripetono in una variazione o nell'altra in altre è, ovviamente, molto più piccolo e può essere facilmente ridotto a una dozzina.

  • Modelli di regressione(modello di regressione)
  • Modelli autoregressivi( ,AR)
  • Modelli di reti neurali(rete neurale artificiale, ANN)
  • Modelli di smoothing esponenziale( ,ES)
  • Modelli basati su catene di Markov(catena di Markov)
  • Classificazione-Alberi di regressione(alberi di classificazione e regressione, CART)
  • Supporta la macchina vettoriale(supporto macchina vettoriale, SVM)
  • algoritmo genetico(algoritmo genetico, GA)
  • Modello di funzione di trasferimento(funzione di trasferimento, TF)
  • Logica fuzzy formalizzata(logica fuzzy, FL)
  • Modelli fondamentali

L'autore di un articolo sulle previsioni nel marketing ha giustamente osservato che “ come ogni strumento, la matematica può essere pericolosa nelle mani di un dilettante. Per verificare i tuoi calcoli, puoi coinvolgere qualcuno con forti capacità statistiche per analizzare le tue informazioni.». Modelli matematici di previsione richiedono competenze sviluppate non solo in matematica, ma anche in programmazione, possesso di complessi pacchetti statistici per creare non solo un modello accurato e veloce.

Migliorare la precisione delle previsioni

Naturalmente, entrambi i tipi di previsione considerati spesso lavorano insieme, ad esempio, sulla base di un algoritmo complesso, vengono calcolati i valori futuri delle serie temporali e quindi l'esperto verifica l'adeguatezza di queste cifre. In questa fase, l'esperto può apportare modifiche manuali che, data la sua elevata qualificazione, possono influire positivamente sulla qualità della previsione.

In totale, se è necessario migliorare l'accuratezza delle previsioni degli esperti nelle attività di marketing, è necessario seguire direttamente i consigli forniti nell'articolo. Se ti trovi di fronte al compito di migliorare l'accuratezza delle previsioni attraverso modelli matematici complessi, veloci e implementati da software, allora dovresti distogliere lo sguardo, cioè una previsione fatta sulla base di una serie di previsioni indipendenti. Presto parlerò previsione di consenso maggiori dettagli in questo blog.

1

Nell'articolo, su esempi specifici, vengono considerati vari metodi matematici di previsione nel tempo, tra cui semplice estrapolazione, metodi basati sui tassi di crescita e modelli matematici. È dimostrato che la scelta del metodo dipende dalla base di previsione - informazioni per il periodo di tempo precedente.

previsione

biostatistica

1. Afanasiev V.N., Yuzbashev M.M. Analisi e previsione delle serie temporali: un libro di testo. - M.: Finanza e statistica, 2001. - 228 p.

2. Petri A., Sabin K. Statistica visiva in medicina. - M.: GEOTAR-MED, 2003. - 144 pag.

3. Sadovnikova N.A., Shmoylova R.A. Analisi e previsione delle serie temporali: libro di testo. – M.: Ed. Centro EAOI, 2001. - 67 p.

Di solito, la previsione è intesa come il processo di previsione del futuro sulla base di alcuni dati del passato, ad es. si studia lo sviluppo del fenomeno di interesse nel tempo. Quindi il valore previsto viene considerato in funzione del tempo y=f(t) . Tuttavia, in medicina vengono presi in considerazione anche altri tipi di prognosi: viene prevista una diagnosi, il valore diagnostico di un nuovo test, un cambiamento di un fattore sotto l'influenza di un altro, ecc.

Lo scopo dell'articolo era quello di presentare vari metodi di previsione e approcci al loro corretto utilizzo in medicina.

Materiali e metodi di ricerca

Nell'articolo vengono presi in considerazione i seguenti metodi di previsione: metodi di estrapolazione semplice, metodo della media mobile, metodo di smoothing esponenziale, metodo di crescita media assoluta, metodo del tasso di crescita medio, metodi di previsione basati su modelli matematici.

Risultati della ricerca e discussione

Come già notato, la previsione si basa su alcune informazioni del passato (base di previsione). Prima di scegliere un metodo di previsione, è utile valutare almeno qualitativamente la dinamica della grandezza studiata nei momenti precedenti. I grafici presentati (Fig. 1) mostrano che può essere diverso.

Riso. 1. Esempi della dinamica della grandezza studiata

Nel primo caso (grafico A) si osserva una stabilità relativa con lievi oscillazioni intorno al valore medio. Nel secondo caso (grafico B) la dinamica è linearmente crescente, nel terzo caso (grafico C) la dipendenza dal tempo è non lineare, esponenziale. Il quarto caso (grafico D) è un esempio di fluttuazioni complesse che hanno più componenti.

Il metodo di previsione a breve termine più comune (1-3 periodi di tempo) è l'estrapolazione, che consiste nell'estendere nel futuro i modelli precedenti. L'uso dell'estrapolazione nelle previsioni si basa sulle seguenti ipotesi:

Lo sviluppo del fenomeno in esame nel suo complesso è descritto da una curva liscia;

L'andamento generale dello sviluppo del fenomeno nel passato e nel presente non subirà grandi cambiamenti in futuro.

Il primo metodo dei metodi di estrapolazione semplice è il metodo della media in serie. In questo metodo si assume il livello predetto della grandezza in studio pari al valore medio dei livelli della serie di tale grandezza nel passato. Questo metodo viene utilizzato se il livello medio non tende a cambiare, o questa variazione è insignificante (non c'è un trend chiaro, Fig. 1, grafico A)

dove yprog è il livello previsto del valore studiato; yi - valore dell'i-esimo livello; n - base di previsione.

In un certo senso, il segmento della serie temporale coperto dall'osservazione può essere paragonato a un campione, il che significa che la previsione risultante sarà selettiva, per la quale può essere specificato un intervallo di confidenza

dove è la deviazione standard della serie storica; tα -Test dello studente per un dato livello di significatività e il numero di gradi di libertà (n-1).

Esempio. In tavola. 1 mostra i dati della serie storica y(t). Calcolare il valore previsto di y all'istante t =13 utilizzando il metodo delle serie medie.

Tabella 1

Dati della serie storica y(t)

(80+98+94+103)/4

(80+98+94+103+84)/5

(80+98+94+103+84+115)/6

(80+98+94+103+84+115+98)/7

(80+98+94+103+84+115+98+113)/8

(80+98+94+103+84+115+98+113+114)/9

(80+98+94+103+84+115+98+113+114+87)/10

(80+98+94+103+84+115+98+113+114+87+107)/11

(80+98+94+103+84+115+98+113+114+87+107+85)/12

La serie originale e smussata sono mostrate in Fig. 2, calcolo y - nella tabella. 2.

Riso. 2. Serie iniziale e smussata

Tavolo 2

Intervallo di confidenza per la previsione al tempo t =13

Il metodo della media mobile è un metodo di previsione a breve termine basato sulla procedura per livellare i livelli del valore studiato (filtraggio). Prevalentemente vengono utilizzati filtri di anti-aliasing lineare con un intervallo m, ad es.

.

Intervallo di confidenza

dove è la deviazione standard della serie storica; tα - Test di Student per un dato livello di significatività e il numero di gradi di libertà (n-1).

Esempio. In tavola. 3 mostra i dati della serie storica y(t). Calcolare il valore previsto y al tempo t =13 utilizzando il metodo della media mobile con un intervallo di livellamento m=3.

La serie originale e smussata sono mostrate in Fig. 3, calcolo y - nella tabella. 4.

Tabella 3

Dati della serie storica y(t)

Riso. 3. Serie iniziale e smussata

Tabella 4

Valore predittivo y

Il metodo di smoothing esponenziale è un metodo in cui i valori dei livelli precedenti, presi con un certo peso, vengono utilizzati nel processo di livellamento di ogni livello. Man mano che ci si allontana da un certo livello, il peso di questa osservazione diminuisce. Il valore livellato del livello all'istante t è determinato dalla formula

dove St è il valore livellato corrente; yt - valore attuale della serie originale; St - 1 - valore livellato precedente; α - parametro di levigatura.

S0 è preso uguale alla media aritmetica dei primi valori della serie.

Per calcolare α si propone la seguente formula

Non c'è consenso sulla scelta di α, questo problema di ottimizzazione del modello non è stato ancora risolto. Alcune pubblicazioni consigliano di scegliere 0,1 ≤ α ≤ 0,3.

La previsione è calcolata come segue

.

Intervallo di confidenza

Tabella 5

Dati della serie storica y(t)

0,3×80+(1-0,3)×90,7

0,3×98+(1-0,3)×87,5

0,3×94+(1-0,3)×90,6

0,3⋅103+(1-0,3)×91,6

0,3×84+(1-0,3)×95

0,3⋅115+(1-0,3)×91,7

0,3×98+(1-0,3)×98,7

0,3⋅113+(1-0,3)×98,5

0,3⋅114+(1-0,3) ⋅102,8

0,3×87+(1-0,3) ⋅106,2

0,3⋅107+(1-0,3) ⋅100,4

0,3×85+(1-0,3) ⋅102,4

97.2+0.3× (85-97.2)

La serie originale e smussata sono mostrate in Fig. 4, calcolo y - nella tabella. 6.

Riso. 4. Serie iniziale e smussata

Tabella 6

Valore di previsione y all'istante t =11

Il prossimo metodo di previsione è il metodo della crescita media assoluta Il livello previsto della quantità studiata cambia in base alla crescita media assoluta di questa quantità nel passato. Questo metodo si applica se l'andamento generale della dinamica è lineare (per il caso mostrato in Fig. 1, grafico B)

dove ; y0 - il livello base di estrapolazione è selezionato come media degli ultimi valori della serie originale; - incremento medio assoluto dei livelli della serie; l è il numero di intervalli di previsione.

Come livello base viene preso il valore medio degli ultimi valori della serie, massimo tre.

Tabella 7

Dati della serie storica y(t)

Previsione = y0+Δl

(60+75+70)/3=68,3

(75+70+103)/3=82,7

(70+103+100)/3=91

(103+100+115)/3=106

(100+115+125)/3=113,3

(115+125+113)/3=117,7

(125+113+138)/3=125,3

(113+138+136)/3=129

(138+136+145)/3=139,7

(136+145+150)/3=143,7

143,7+8,2⋅1=151,9

143,7+8,2⋅2=160,1

143,7+8,2⋅3=168,3

La serie originale e smussata sono mostrate in Fig. 5.

Riso. 5. Serie iniziale e smussata

Metodo del tasso di crescita medio

Il livello previsto della quantità oggetto di studio cambia in base al tasso di crescita medio di tale quantità nel passato. Questo metodo viene utilizzato se l'andamento generale della dinamica è caratterizzato da una curva esponenziale o esponenziale (Fig. 1B)

dove è il tasso di crescita medio nel passato; l è il numero di intervalli di previsione.

La stima predittiva dipenderà dalla direzione in cui il livello base y0 si discosta dal trend principale (trend), quindi si consiglia di calcolare y0 come valore medio degli ultimi valori della serie.

Tabella 8

Dati della serie storica y(t)

62,5⋅1,081 = 67,7

(70/60)1/2 =1,08

65⋅1,081 = 70,2

(65+70+68)/3=67,7

(68/60)1/3 =1,04

67,7⋅1,041 =70,5

(70+68+82)/3=73,3

(82/60)1/4 =1,08

73,3⋅1,081 =79,3

(68+82+80)/3=76,7

(80/60)1/5 =1,06

76,7⋅1,061 =81,2

(82+80+95)/3=85,7

(95/60)1/6 =1,08

85,7⋅1,081 =92,5

(80+95+113)/3=96

(113/60)1/7 =1,09

96⋅1,091 =105,1

(95+113+135)/3=114,3

(135/60)1/8 =1,11

114,3⋅1,111 =126,5

(113+135+140)/3=129,3

(140/60)1/9 =1,10

129,3⋅1,11 =142,1

(135+140+168)/3=147,7

(168/60)1/10 =1,11

147,7⋅1,111 =163,7

(140+168205)/3=171

(205/60)1/11 =1,12

171⋅1,121 =191,2

171⋅1,122 =213,8

171⋅1,123 =239,1

La serie originale e smussata sono mostrate in Fig. 6.

Riso. 6. Serie iniziale e smussata

Ad oggi, il metodo di previsione più comune consiste nel trovare un'espressione analitica (equazione) dell'andamento. L'andamento del fenomeno estrapolato è l'andamento principale delle serie storiche, in qualche misura libero da influenze casuali.

Lo sviluppo della previsione consiste nel determinare il tipo di funzione estrapolante y=f(t), che esprime la dipendenza del valore studiato dal tempo sulla base dei dati iniziali osservati. Il primo passo è scegliere il tipo ottimale di funzione che fornisce la migliore descrizione dell'andamento. Le dipendenze più comunemente usate sono:

lineare;

parabolico;

Funzione esponenziale ;

I problemi di trovare i coefficienti di una funzione lineare e la previsione basata su di essa sono considerati nella sezione statistica "analisi di regressione". Se la forma della curva che descrive l'andamento non è lineare, allora il compito di stimare la funzione y=f(t) diventa più complicato, e in questo caso è necessario coinvolgere i biostatistici nell'analisi e utilizzare programmi per computer per la statistica elaborazione dati.

Nella maggior parte dei casi reali, la serie storica è una curva complessa che può essere rappresentata come la somma o il prodotto delle componenti di trend, stagionali, cicliche e casuali.

La tendenza è un cambiamento graduale nel processo nel tempo ed è dovuta all'azione di fattori a lungo termine. L'effetto stagionale è associato alla presenza di fattori che agiscono con una periodicità predeterminata (ad esempio le stagioni, i cicli lunari). La componente ciclica descrive lunghi periodi di relativa salita e discesa ed è costituita da cicli di durata e ampiezza variabili (ad esempio, alcune epidemie sono di natura ciclica lunga). La componente casuale della serie riflette l'impatto di numerosi fattori casuali e può avere una struttura varia.

Conclusione

I metodi di estrapolazione semplice, il metodo delle medie mobili, il metodo del livellamento esponenziale sono i più semplici e allo stesso tempo i più approssimativi - questo può essere visto dagli ampi intervalli di confidenza negli esempi forniti. In caso di forti fluttuazioni di livello si osserva un grande errore di previsione. Va notato che è illegale utilizzare questi metodi se c'è una chiara tendenza al rialzo (o al ribasso) nelle serie temporali iniziali. Tuttavia, per le previsioni a breve termine, il loro utilizzo è giustificato.

L'analisi di tutte le componenti delle serie temporali e la previsione basata su di esse non è un compito banale, è considerata nella sezione statistica "analisi delle serie temporali" e richiede una formazione speciale.

Collegamento bibliografico

Koichubekov BK, Sorokina MA, Mkhitaryan KE METODI MATEMATICI DI PREVISIONE IN MEDICINA // Successi delle moderne scienze naturali. - 2014. - N. 4. - P. 29-36;
URL: http://natural-sciences.ru/ru/article/view?id=33316 (data di accesso: 30/03/2019). Portiamo alla vostra attenzione le riviste pubblicate dalla casa editrice "Accademia di Storia Naturale" il 23 aprile 2013 alle 11:08

Classificazione di metodi e modelli di previsione

  • Matematica
  • tutorial

Faccio previsioni di serie temporali da oltre 5 anni. L'anno scorso ho difeso la mia tesi sull'argomento " Modello di previsione delle serie temporali dal campione di massima somiglianza”, tuttavia, dopo la difesa, sono rimaste non poche domande. Eccone uno - classificazione generale di metodi e modelli di previsione.


Di solito, nelle opere di autori sia domestici che di lingua inglese, non si pongono la questione della classificazione dei metodi e dei modelli di previsione, ma semplicemente li elencano. Ma mi sembra che oggi quest'area sia cresciuta e ampliata a tal punto che, anche se la più generale, è necessaria una classificazione. Di seguito è riportata la mia versione della classifica generale.

Qual è la differenza tra un metodo di previsione e un modello?

Metodo di previsione rappresenta una sequenza di azioni che devono essere eseguite per ottenere un modello previsionale. Per analogia con la cottura, un metodo è una sequenza di azioni in base alle quali viene preparato un piatto, ovvero viene fatta una previsione.


Modello di previsioneè una rappresentazione funzionale che descrive adeguatamente il processo in esame ed è la base per ottenerne i valori futuri. Nella stessa analogia culinaria, il modello ha un elenco di ingredienti e il loro rapporto, necessario per il nostro piatto: una previsione.


La combinazione di metodo e modello formano una ricetta completa!



Ora è consuetudine utilizzare abbreviazioni inglesi per i nomi sia dei modelli che dei metodi. Ad esempio, c'è il famoso modello di previsione ARIMAX (Integrated Moving Average Extended). Questo modello e il suo metodo corrispondente sono solitamente chiamati ARIMAX e talvolta il modello (metodo) di Box-Jenkins dagli autori.

Per prima cosa classifichiamo i metodi

Se guardi da vicino, diventa subito chiaro che il concetto di " metodo di previsione"concetto molto più ampio" modello predittivo". A questo proposito, nella prima fase della classificazione, i metodi sono solitamente divisi in due gruppi: intuitivi e formalizzati.



Se ricordiamo la nostra analogia culinaria, allora anche lì possiamo dividere tutte le ricette in formalizzate, cioè scritte dal numero degli ingredienti e dal metodo di preparazione, e intuitive, cioè non registrate da nessuna parte e ottenute dall'esperienza di lo specialista culinario. Quando non usiamo una prescrizione? Quando il piatto è molto semplice: friggere le patate o lessare gli gnocchi, non serve una ricetta. Quando altrimenti non usiamo la ricetta? Quando vogliamo inventare qualcosa di nuovo!


Metodi di previsione intuitivi trattare i giudizi e le valutazioni di esperti. Ad oggi, sono spesso utilizzati in marketing, economia, politica, poiché il sistema, il cui comportamento deve essere previsto, o è molto complesso e non può essere descritto matematicamente, oppure è molto semplice e non necessita di tale descrizione. I dettagli su tali metodi possono essere trovati in .


Metodi formalizzati- metodi di previsione descritti in letteratura, a seguito dei quali vengono costruiti modelli di previsione, ovvero determinano una tale dipendenza matematica che consente di calcolare il valore futuro del processo, ovvero fare una previsione.


Su questo si può completare, a mio avviso, la classificazione generale dei metodi di previsione.

Successivamente, facciamo una classificazione generale dei modelli

Qui è necessario procedere alla classificazione dei modelli previsionali. Nella prima fase, i modelli dovrebbero essere divisi in due gruppi: modelli di dominio e modelli di serie temporali.




Modelli di dominio- tali modelli matematici previsionali, per la cui costruzione si utilizzano le leggi dell'area disciplinare. Ad esempio, un modello utilizzato per fare una previsione meteorologica contiene le equazioni della fluidodinamica e della termodinamica. La previsione dello sviluppo della popolazione è fatta su un modello costruito su un'equazione differenziale. La previsione del livello di zucchero nel sangue di una persona con diabete viene effettuata sulla base di un sistema di equazioni differenziali. In breve, tali modelli utilizzano dipendenze specifiche per una particolare area tematica. Tali modelli sono caratterizzati da un approccio individuale allo sviluppo.


Modelli di serie temporali- modelli matematici di previsione che cercano di trovare la dipendenza del valore futuro dal passato all'interno del processo stesso e calcolano la previsione su questa dipendenza. Questi modelli sono universali per varie aree tematiche, ovvero la loro forma generale non cambia a seconda della natura delle serie temporali. Possiamo utilizzare le reti neurali per prevedere la temperatura dell'aria e quindi applicare un modello simile alle reti neurali per prevedere gli indici azionari. Questi sono modelli generalizzati, come l'acqua bollente, in cui se lanci un prodotto, bollirà, indipendentemente dalla sua natura.

Classificazione dei modelli di serie temporali

Mi sembra che non sia possibile fare una classificazione generale dei modelli di dominio: quanti domini, quanti modelli! Tuttavia, i modelli delle serie temporali si prestano facilmente a una semplice divisione. I modelli delle serie temporali possono essere divisi in due gruppi: statistici e strutturali.




A modelli statistici la dipendenza del valore futuro dal passato è data sotto forma di qualche equazione. Questi includono:

  1. modelli di regressione (regressione lineare, regressione non lineare);
  2. modelli autoregressivi (ARIMAX, GARCH, ARDLM);
  3. modello di smoothing esponenziale;
  4. modello basato sul campione di massima similarità;
  5. eccetera.

A modelli strutturali la dipendenza del valore futuro dal passato è data sotto forma di una certa struttura e regole per percorrerla. Questi includono:

  1. modelli di reti neurali;
  2. modelli basati su catene di Markov;
  3. modelli basati su alberi di classificazione-regressione;
  4. eccetera.

Per entrambi i gruppi ho indicato i principali, cioè i più comuni e dettagliati modelli di previsione. Tuttavia, oggi esiste già un numero enorme di modelli di previsione delle serie temporali e per fare previsioni, ad esempio, sono stati utilizzati modelli SVM (support vector machine), modelli GA (algoritmo genetico) e molti altri.

Classificazione generale

Così abbiamo ottenuto quanto segue classificazione dei modelli e metodi di previsione.




  1. Tikhonov E.E. Previsioni a condizioni di mercato. Nevinnomyssk, 2006. 221 pag.
  2. Armstrong J.S. Previsioni per il marketing // Metodi quantitativi nel marketing. Londra: International Thompson Business Press, 1999, pp. 92–119.
  3. Jingfei Yang M.Sc. Power System Previsione del carico a breve termine: tesi di dottorato. Germania, Darmstadt, Elektrotechnik und Informationstechnik der Technischen Universitat, 2006. 139 p.
UPD. 15/11/2016.
Signori, ha raggiunto la pazzia! Di recente, mi è stato inviato un articolo per l'edizione VAK con un collegamento a questa voce per la revisione. Attiro la vostra attenzione sul fatto che né nei diplomi, né negli articoli, e ancor più nelle dissertazioni impossibile collegarsi al blog! Se vuoi un link usa questo: Chuchueva I.A. MODELLO DI PREVISIONE DI SERIE TEMPORALI SULLA SELEZIONE DELLA MASSIMA SIMILARITÀ, dissertazione… cand. quelli. Scienze / Università tecnica statale di Mosca. NE Bauman. Mosca, 2012.

Appendice 1. METODI DI ANALISI STATISTICA E DI PREVISIONE NELLE IMPRESE

4. Strumenti di previsione matematica

I metodi e i modelli matematici utilizzati nei problemi di analisi stocastica e di previsione negli affari possono essere correlati a vari rami della matematica: analisi di regressione, analisi di serie temporali, formazione e valutazione di opinioni di esperti, modelli di simulazione, sistemi di equazioni simultanee, analisi discriminante, logit e i modelli probit, l'apparato delle funzioni di decisione logica, l'analisi della varianza o covarianza, l'analisi delle correlazioni di rango e delle tabelle di contingenza, ecc. Tuttavia, sono tutti accomunati dal fatto che rappresentano approcci diversi per risolvere il problema centrale dell'analisi statistica multivariata e econometria - problemi di studio statistico delle dipendenze, che è giusto problema di base dell'analisi statistica e delle previsioni nel mondo degli affari (la sua formulazione generale è stata data al paragrafo 2).

Al comma 1 si è già osservato che tra p+k+l+m Le componenti della caratteristica multidimensionale analizzata possono essere sia variabili quantitative che ordinali e nominali. Gli approcci sopra menzionati per risolvere il problema centrale dell'analisi statistica multivariata sono stati formati tenendo conto della natura delle variabili oggetto di studio. La corrispondente specializzazione di questi approcci si riflette nella tabella. 4. Contiene anche riferimenti a fonti letterarie, in cui si può trovare una descrizione abbastanza completa di questi approcci.

Tabella 4

La natura degli indicatori risultanti

La natura delle variabili esplicative

Il nome delle sezioni del servizio dell'analisi statistica multivariata

Fonti letterarie

quantitativo

quantitativo

Analisi di regressione e sistemi di equazioni simultanee

quantitativo

L'unica variabile quantitativa interpretata come "tempo"

Analisi delle serie temporali

quantitativo

Non quantitativo (variabili ordinali o nominali)

Analisi della varianza

quantitativo

Analisi di covarianza, modelli di regressione tipologica

Non quantitativo (variabili ordinali)

Non quantitativo (variabili ordinali e nominali)

Analisi delle correlazioni di rango e delle tabelle di contingenza

Non quantitativo (variabili nominali)

quantitativo

Analisi discriminante, modelli logit e probit, analisi dei cluster, tassonomia, scissione di miscele di distribuzioni

Misto (variabili quantitative e non quantitative)

Misto (variabili quantitative e non quantitative)

Apparato di funzioni di decisione logica, Data Mining

Tuttavia, la pratica dell'analisi statistica e della previsione nelle imprese mostra che nell'intero spettro dei loro strumenti matematici, la leadership incontrastata (in termini di prevalenza e rilevanza) appartiene a tre sezioni:
- analisi di regressione;
-
analisi di serie temporali;
-
il meccanismo di formazione e analisi statistica delle perizie.

Diamo un'occhiata brevemente a ciascuna di queste sezioni.

Analisi di regressione

Come prima, descriveremo il funzionamento dell'oggetto reale oggetto di studio (impresa, azienda, processo produttivo o distribuzione del prodotto, ecc.) mediante un insieme di variabili e (il loro significato significativo è descritto nel paragrafo 2). Introduciamo una serie di definizioni e concetti utilizzati nell'analisi di regressione.

Variabili risultanti (dipendenti, endogene). La variabile che caratterizza il risultato o l'efficienza del sistema analizzato è chiamata risultante (dipendente, endogena). I suoi valori si formano durante e all'interno del funzionamento di questo sistema sotto l'influenza di una serie di altre variabili e fattori, alcuni dei quali possono essere registrati e, in una certa misura, gestiti e pianificati (questa parte è comunemente chiamata variabili esplicative , vedi sotto). Nell'analisi di regressione, la variabile risultante funge da funzione, i cui valori sono determinati (sebbene con qualche errore casuale) dai valori delle suddette variabili esplicative che fungono da argomenti. Pertanto, per sua natura, la variabile risultante è sempre stocastica (casuale). Nel caso generale, di solito viene analizzato il comportamento di più variabili risultanti .

Variabili esplicative (predittive, esogene). . Le variabili (o segni) che possono essere registrate, che descrivono le condizioni per il funzionamento del sistema economico reale oggetto di studio e determinano in larga misura il processo di formazione dei valori delle variabili risultanti, sono dette esplicative. Di norma, alcuni di essi si prestano a una regolamentazione e gestione almeno parziale. I valori di una serie di variabili esplicative possono essere impostati come se fossero "al di fuori" del sistema analizzato. In questo caso, sono chiamati esogeni. Nell'analisi di regressione, svolgono il ruolo di argomenti della funzione, che è considerata l'indicatore risultante analizzato. Per loro natura, le variabili esplicative possono essere casuali o non casuali.

Residui di regressione- si tratta di componenti casuali latenti (ovvero nascosti, non suscettibili di misurazione diretta), che riflettono l'impatto, rispettivamente, su non presi in considerazione nella composizione dei fattori, nonché errori casuali nella misurazione delle variabili risultanti analizzate. In generale, possono anche dipendere, cioè nel caso generale.

Lo schema generale dell'interazione delle variabili nell'analisi di regressione è mostrato in figura.




Foto . Schema generale di interazione delle variabili nell'analisi di regressione.

funzione di regressione su. La funzione viene chiamata funzione di regressione da (o semplicemente - regressione su) se descrive la variazione del valore medio condizionale della variabile risultante (assumendo che i valori delle variabili esplicative siano fissati a livelli) in funzione della variazione dei valori delle variabili esplicative. Di conseguenza, matematicamente, questa definizione può essere scritta come

dove il simbolo indica l'operazione di media teorica dei valori (cioè è l'aspettativa matematica della variabile casuale, e, o semplicemente è l'aspettativa matematica condizionata della variabile casuale, calcolata alla condizione che i valori della variabile le variabili sono fisse a livello).

Se analizziamo contemporaneamente le variabili risultanti, allora dovremmo considerare rispettivamente le funzioni di regressione o, che è la stessa, una a valore vettoriale funzione

. (11)

Poi il modello di regressione può essere scritto nel modulo

, (12)

inoltre, dalla definizione consegue che sempre]

(12’)

(identico il segno di uguale in (12') significa che è valido per qualunque valori; il vettore colonna degli zeri sul lato destro ha dimensione ).

problema di regressione nella sua forma più generale può essere formulata come segue:

secondo i risultati delle misurazioni

delle variabili oggetto di studio sugli oggetti (sistemi, processi) della popolazione analizzata, costruire una tale funzione (a valori vettoriali) (11) che consenta nel modo migliore (in un certo senso) di ripristinare i valori della variabili risultanti (previste). da valori dati di variabili esplicative (esogene).

Nota 1. I più comuni sono lineare modelli di regressione, ovvero modelli in cui le funzioni di regressione hanno una forma lineare:

Osservazione 2. Esistono almeno due opzioni per interpretare le variabili “comportamentali”, “di stato” ed “esterne” introdotte rispettivamente nella Sezione 2 e nell'ambito del modello di regressione descritto (12)–(12 '). Nella prima variante tutti e tre i tipi variabili e fare riferimento a variabili esplicative e costruire una regressione su . In un'altra variante, le variabili e vengono interpretate come condizioni di osservazione e poi separatamente per ogni combinazione fissa di queste condizioni viene costruito un modello di regressione della forma (12) (nell'ambito di un modello lineare (12''), ciò significa che i coefficienti di regressione stessi dipendono da e , ovvero sono definiti come funzioni di e ).

Analisi delle serie temporali

Qualsiasi analisi statistica e previsione si basa sui dati statistici iniziali. Le loro tipologie principali sono state presentate nel paragrafo 1. Allo stesso tempo, se il processo di registrazione dei dati avviene nel tempo, e il tempo stesso è fissato insieme ai valori delle caratteristiche analizzate, allora si parla di analisi statistica del cosiddetto dati del pannello. Se fissiamo il numero della variabile e il numero dell'oggetto esaminato statisticamente, allora la sequenza di valori si trova in ordine cronologico

chiamata serie temporali unidimensionali. Se, tuttavia, consideriamo simultaneamente serie temporali unidimensionali della forma (13), cioè esaminiamo i modelli in interconnesso comportamento delle serie temporali (13) per , che caratterizza la dinamica delle variabili, misurato su qualcuno(-m) oggetto, poi parlano analisi statistica serie temporali multivariate. In sostanza, tutti i compiti relativi all'analisi delle dinamiche economiche e alla previsione comportano l'utilizzo di serie storiche di determinati indicatori come base statistica.

Di norma, solo nelle attività di previsione aziendale discreto (dal tempo di osservazione) serie temporali unidimensionali per momenti di osservazione equidistanti, ovvero dove si trova un determinato periodo di tempo (minuti, ora, giorno, settimana, mese, trimestre, anno, ecc.). In questi casi, ci sarà più conveniente rappresentare nella forma le serie temporali oggetto di studio

dove è il valore dell'indicatore analizzato, registrato nel th step temporale.

Parlando dell'uso dell'apparato di analisi delle serie temporali nel problema della previsione, si intende brevemente- e medio termine previsione, perché la costruzione lungo termine la previsione implica l'uso obbligatorio di metodi di organizzazione e di analisi statistica perizie speciali.

Genesi delle osservazioni che formano le serie temporali. Stiamo parlando della struttura e della classificazione dei principali fattori, sotto l'influenza di cui si formano i valori degli elementi delle serie temporali. È consigliabile distinguere i seguenti 4 tipi di tali fattori.

(MA) lungo termine, formando una tendenza generale (a lungo termine) al cambiamento del tratto analizzato. Di solito questa tendenza viene descritta utilizzando l'una o l'altra funzione non casuale f tr (t), solitamente monotono. Questa funzione è chiamata funzione di tendenza o semplicemente tendenza.

(B) di stagione, che formano fluttuazioni del tratto analizzato che si ripetono periodicamente in un determinato periodo dell'anno. Accettiamo di denotare il risultato dell'azione di fattori stagionali con l'ausilio di una funzione non casuale. Poiché questa funzione dovrebbe essere periodico(con periodi multipli di stagioni, cioè quarti), le armoniche (funzioni trigonometriche) partecipano alla sua espressione analitica, la cui frequenza, di regola, è determinata dal contenuto del problema.

(A) Ciclico (opportunistico) che formano cambiamenti nel tratto analizzato, dovuti all'azione di cicli a lungo termine di natura economica, demografica o astrofisica (onde di Kondratiev, "buchi" demografici, cicli di attività solare, ecc.). Il risultato dell'azione di fattori ciclici sarà denotato da una funzione non casuale.

(G) Casuale(irregolare), non suscettibile di contabilità e registrazione. Il loro impatto sulla formazione dei valori delle serie temporali determina solo natura stocastica elementi, e quindi la necessità di interpretazioni come osservazioni fatte su variabili casuali, rispettivamente. Indicheremo il risultato dell'impatto di fattori casuali con l'aiuto di variabili casuali ("residui", "errori"). Naturalmente, non è affatto necessario che i fattori partecipino contemporaneamente al processo di formazione dei valori di qualsiasi serie temporale. Tutto quattro tipi. In alcuni casi, i valori delle serie temporali possono essere formati sotto l'influenza dei fattori (A), (B) e (D), in altri - sotto l'influenza dei fattori (A), (C) e (D ) e, infine, esclusivamente sotto l'influenza dei soli fattori casuali (D). Tuttavia, in tutti i casi l'indispensabile partecipazione del casuale (evolutivo) fattori (D). Inoltre, è generalmente accettato (come ipotesi) strutturale additivo schema l'influenza dei fattori (A), (B), (C) e (D) sulla formazione dei valori, il che significa la legittimità di rappresentare i valori dei membri delle serie temporali sotto forma di scomposizione:

Le conclusioni sul fatto che fattori di questo tipo siano coinvolti o meno nella formazione dei valori possono essere basate sia sull'analisi dell'essenza del contenuto del compito (cioè essere esperto a priori in natura), e su uno speciale analisi statistica delle serie temporali studiate.

Nell'ambito dei concetti introdotti e della notazione problema di analisi statistica delle serie temporali in generale si possono formulare come segue:

sulla base dei risultati delle misurazioni della variabile in studio per i tick temporali del periodo base, costruire le migliori (in un certo senso) stime per i termini di espansione (14).

La soluzione di questo problema viene utilizzata per costruire un valore predittivo per tick di tempo avanti utilizzando la formula (14) con e sostituendo in essa le stime ottenute delle componenti del lato destro della decomposizione.

Meccanismi di formazione e analisi statistica delle valutazioni degli esperti

Di solito si distinguono i seguenti tipi principali di organizzazione del lavoro di un gruppo di esperti ():

· collegiale: “metodo delle commissioni” (sotto forma di discussione aperta sul problema in discussione); "metodo giudiziario" (nella forma del confronto tra "difesa" e "addebito" per ciascuna delle opzioni per la soluzione discussa del problema); "brainstorming", ecc.;

· parzialmente collegiale: analisi di scenario del tipo "what-if", il metodo "Delphi": una discussione a più turni del problema con il voto segreto di esperti o la compilazione di appositi questionari anonimi alla fine di ogni round e il lavoro di un gruppo analitico indipendente tra i round, ecc .;

· individualmente autonomo: ciascuno dei membri del gruppo di esperti forma ed esprime la propria opinione (indipendentemente dalle posizioni degli altri partecipanti) sotto forma di graduatoria delle soluzioni (o oggetti discussi), dei loro confronti appaiati o assegnando a ciascuno di essi una delle gradazioni precedentemente descritte (vedi moduli per presentare i dati statistici iniziali sotto forma di tabelle di frequenza o tabelle di contingenza tra le opinioni del -esimo e -esimo esperto è misurato dal valore , dove è il coefficiente di correlazione del rango di Spearman (vedi, cap. 11]) Possiamo quindi risolvere il problema del "clustering" di esperti, interpretando ciascuno dei cluster così trovati come un gruppo di esperti che la pensano allo stesso modo.

(ii) Analisi del reciproco consenso dei pareri del gruppo di esperti. Avendo i pareri di un intero gruppo di esperti, lo statistico cerca di valutare il grado di coerenza di tutte queste valutazioni peritali, anche verificando statisticamente l'ipotesi della totale assenza di coerenza (e poi, ovviamente, si dovrebbe o chiarire la formulazione di problema proposto dagli esperti, o modificare la composizione del gruppo di esperti). Questo problema viene risolto anche mediante l'analisi statistica multivariata. La scelta di un metodo specifico dipende dalla forma dei dati statistici iniziali. Ad esempio, se le opinioni degli esperti sono rappresentate da graduatorie, allora come misura della loro coerenza si può considerare coefficiente di oggetti), cioè con i dati statistici iniziali della forma è definita come soluzione ad un problema di ottimizzazione della forma j-esimo esperto è tanto più lontano dall'opinione unificata del gruppo, tanto più basso è stimato il livello della sua competenza relativa. Si noti che se, a seguito dello studio della struttura della totalità delle opinioni degli esperti, lo statistico giunge alla conclusione che diversi sottogruppi di esperti con omogeneità di opinioni all'interno di ciascun sottogruppo e con una differenza significativa di opinioni in qualsiasi coppia di tali sottogruppi, quindi il compito di un'opinione di gruppo unica e una valutazione della competenza relativa di un esperto viene risolto separatamente per ciascuno dei sottogruppi individuati.


I fattori casuali, a loro volta, possono essere di duplice natura: improvviso(“disordine”), che porta a bruschi cambiamenti strutturali nel meccanismo di formazione dei valori x(t)(che si esprime, ad esempio, in radicali mutamenti spasmodici nelle caratteristiche strutturali di base delle funzioni f tr(t), j(t) e y(t) serie temporali analizzate in un momento casuale), e residuo evolutivo, causando deviazioni casuali relativamente piccole dei valori x(t) da quelli che avrebbero dovuto essere sotto l'influenza di fattori (A), (B) e (C). Tuttavia, in questa sezione, verranno presi in considerazione schemi di formazione di serie temporali, compresa l'azione solo evolutivo fattori casuali residui.

Precedente
Caricamento in corso...Caricamento in corso...