Matematiska metoder för prognoser. Framgångar för modern naturvetenskap

Ekonomiska och matematiska metoder. Vid användning av ekonomiska och matematiska metoder etableras och verifieras modellernas struktur experimentellt, under förhållanden som tillåter objektiv observation och mätning.

Bestämning av systemet av faktorer och orsaksstrukturen för fenomenet som studeras - Första stadiet matematisk modellering.

Statistiska metoder intar en speciell plats i prognoser. Metoderna för matematisk och tillämpad statistik används vid planering av allt arbete med prognoser, vid bearbetning av data som erhålls både med intuitiva metoder och genom att använda egentliga ekonomiska och matematiska metoder. De används i synnerhet för att bestämma antalet expertgrupper, intervjuade medborgare, frekvensen av datainsamling och utvärdera parametrarna för teoretiska ekonomiska och matematiska modeller.

Var och en av dessa metoder har fördelar och nackdelar. Alla prognosmetoder kompletterar varandra och kan användas tillsammans.

Scenariometod- Ett effektivt verktyg för att organisera prognoser, kombinera kvalitativa och kvantitativa tillvägagångssätt.

Ett scenario är en framtidsmodell, som beskriver det möjliga händelseförloppet och anger sannolikheterna för deras genomförande. Scenariot identifierar de viktigaste faktorerna som ska beaktas och anger hur dessa faktorer kan påverka de förväntade händelserna. Som regel sammanställs flera alternativa scenarier. Ett scenario är alltså en karaktärisering av framtiden i en utforskande prognos, inte en definition av ett möjligt eller önskat framtidstillstånd. Vanligtvis betraktas den mest sannolika varianten av scenariot som basvarianten, på grundval av vilken beslut fattas. Andra versioner av scenariot, betraktade som alternativa, planeras i händelse av att verkligheten börjar närma sig deras innehåll i större utsträckning, och inte till grundversionen av scenariot. Scenarier är vanligtvis beskrivningar av händelser och uppskattningar av indikatorer och egenskaper över tid. Förberedelsemetoden för scenario användes först för att identifiera möjliga resultat av militära operationer. Senare började scenarioprognoser användas i den ekonomiska politiken och sedan i strategisk företagsplanering. Nu är det den mest välkända integrationsmekanismen för att prognostisera ekonomiska processer på marknaden. Scenarier är effektivt botemedel m övervinna traditionellt tänkande. Ett scenario är en analys av en snabbt föränderlig nutid och framtid och dess förberedelse tvingar en att hantera detaljer och processer som kan missas när man använder speciella prognosmetoder isolerat. Därför skiljer sig scenariot från en enkel prognos. Det är ett verktyg som används för att bestämma vilka typer av prognoser som bör utvecklas för att beskriva framtiden med tillräcklig fullständighet, med hänsyn till alla huvudfaktorer.


Användningen av scenarioprognoser under marknadsförhållanden ger:

bättre förståelse av situationen, dess utveckling;

bedömning av potentiella hot;

identifiera möjligheter;

identifiering av möjliga och ändamålsenliga aktivitetsriktningar;

öka graden av anpassning till förändringar i den yttre miljön.

Scenarioprognoser är ett effektivt sätt att förbereda planerade beslut både på ett företag och i stater.

Planering är nära besläktat med prognoser, dessa processer är uppdelade i viss utsträckning villkorligt, därför kan samma metoder eller närbesläktade metoder användas i planering och prognoser.

Plangodkännandebeslut. Planer är resultatet av förvaltningsbeslut som fattas utifrån möjliga planeringsalternativ. Adoption ledningsbeslut utförs enligt vissa kriterier. Med hjälp av dessa kriterier utvärderas alternativen när det gäller att uppnå ett eller flera mål. Kriterier speglar beslutsfattarnas mål.

Ett beslut baserat på ett enda kriterium anses enkelt, och ett beslut baserat på flera kriterier anses vara komplext. Kriterierna i vilka kvantitativa eller ordinala betygsskalor formuleras gör det möjligt att använda matematiska metoder för operationsforskning för att utarbeta lösningar.

Beslut om plangodkännande tenderar att inte bara vara komplexa på grund av flera kriterier, utan rent ut sagt svåra på grund av osäkerhet, begränsad information och stort ansvar. Därför fattas de slutliga besluten om godkännande av planer genom ett heuristiskt, intuitivt urval från ett begränsat antal förberedda alternativ.

Planeringsmetoder är alltså metoder för att förbereda planeringsalternativ, eller åtminstone ett planalternativ, för godkännande av en beslutsfattare eller organ.

Metoder för att upprätta en eller flera varianter av planer kännetecknas av de metoder som används för att upprätta dessa planer, metoder och termer för eventuellt genomförande av planer, planeringsobjekt.

Liksom prognoser kan planering baseras på heuristiska och matematiska metoder. Bland de matematiska metoderna för operationsforskning upptar metoder för optimal planering en speciell plats.

Metoder för optimal planering. För att lösa problemen med att förbereda optimal, det vill säga det bästa enligt vissa kriterier, kan planer, metoder för matematisk programmering användas.

Uppgifterna med matematisk programmering är att hitta max eller minimum av en viss funktion i närvaro av restriktioner för variablerna - lösningens element. Ett stort antal typiska problem för matematisk programmering är kända, för vilkas lösning effektiva metoder, algoritmer och program för datorer, till exempel:

Problem med blandningens sammansättning, som består i att bestämma den diet som har lägsta kostnad och består av olika produkter med olika innehåll näringsämnen, enligt villkoret för att säkerställa att deras innehåll i kosten inte är lägre än en viss nivå;

Uppgifterna för den optimala produktionsplanen, som består i att bestämma den bästa planen för produktion av varor i termer av försäljningsvolym eller vinst med begränsade resurser eller produktionsanläggningar;

Transportuppgifter, vars kärna är valet av en transportplan som säkerställer ett minimum av transportkostnader när man uppfyller givna volymer av leveranser till konsumenter på olika ställen, med olika möjliga rutter, från olika ställen där lager eller produktionskapacitet begränsad.

Spelteoretiska metoder kan användas för att planera under osäkerhet väderförhållanden, förväntade datum naturkatastrofer. Det här är "spel" med en passiv "spelare" som agerar oavsett dina planer.

Metoder har också utvecklats för att lösa spelteoretiska problem med aktiva "spelare" som agerar som svar på den motsatta sidans handlingar. Dessutom har metoder utvecklats för att lösa problem där parternas agerande präglas av vissa strategier - uppsättningar av handlingsregler. Dessa beslut kan vara användbara när man utarbetar planer inför eventuellt motstånd från konkurrenter, mångfald i partners agerande.

Lösningar på spelteoretiska problem kan bero på risknivån man är villig att acceptera, eller baseras helt enkelt på att erhålla den maximala garanterade nyttan. Beslut av vissa slag enkla uppgifter spelteori reduceras till att lösa linjära programmeringsproblem.

Mer detaljerat och korrekt material har publicerats på .

I mars 2011 publicerades noten "Fem sätt att förbättra prediktionsprecisionen". Författaren Aleksey Skripchan övervägde mycket effektivt, enkelt och tillräckligt detaljerat prognosen som måste utföras som en del av marknadsföring och planering. Hans epitet låter intressant i underavsnittet "Fördelarna med bättre prognoser":

Prognoser blir rodret som hjälper ett företag att hålla kursen, ändra riktning eller navigera i okända vatten med tillförsikt...

Jag skulle vilja lägga till några ord till det som redan har sagts. Främst bör det noteras att vi i den nämnda artikeln talar om expertprognoser. Behöver särskilja två typer av prognoser: expert och formaliserad.

Expertprognos

Expertprognoser innebär att en expert bildar framtida värden, dvs. en person med djup kunskap inom ett visst område. I det här fallet använder experten ofta den matematiska apparaten Men i denna typ av prognoser är den matematiska apparaten endast ett extra beräkningsverktyg. Grunden är kunskapen och intuitionen hos en expert, och därför ibland dessa metoder kallas intuitiva.

Expertprognos används när prognosobjektet antingen är för enkelt eller tvärtom så komplext att det är omöjligt att analytiskt ta hänsyn till påverkan av externa faktorer.. Expertmetoder prognoser involverar inte utveckling av prognosmodeller och återspeglar individuella bedömningar av specialister (experter) om utsikterna för utvecklingen av processen. Dessa metoder inkluderar följande metoder.

  • Metod expertbedömningar
  • Metod för historiska analogier
  • Framsyn efter mönster
  • rolig logik
  • Scenariomodellering "tänk om"

Formaliserad prognos är prognos baserad på matematisk modell, som fångar processens mönster, har vid sin produktion de framtida värdena för processen som studeras. en hel del, till exempel, enligt ett antal recensioner finns det för närvarande över 100 klasser av prognosmodeller. Antalet allmänna klasser av modeller som upprepas i en eller annan variant i andra är naturligtvis mycket mindre och kan lätt reduceras till ett dussin.

  • Regressionsmodeller(regressionsmodell)
  • Autoregressiva modeller( ,AR)
  • Neurala nätverksmodeller(artificiellt neuralt nätverk, ANN)
  • Exponentiella utjämningsmodeller( ,ES)
  • Modeller baserade på Markov-kedjor(Markov kedja)
  • Klassificering-Regressionsträd(klassificerings- och regressionsträd, CART)
  • Stöd vektor maskin(stöd vektormaskin, SVM)
  • genetisk algoritm(genetisk algoritm, GA)
  • Överföringsfunktionsmodell(överföringsfunktion, TF)
  • Formaliserad luddig logik(fuzzy logic, FL)
  • Grundläggande modeller

Författaren till en artikel om prognoser inom marknadsföring noterade helt riktigt att " som alla verktyg kan matematik vara farligt i händerna på en amatör. För att kontrollera dina egna beräkningar kan du involvera någon med stark statistisk kompetens för att analysera din information.». Matematiska prognosmodeller kräver utvecklade kompetenser inte bara i matematik, utan också i programmering, innehav av komplexa statistiska paket för att skapa inte bara en korrekt och snabb modell.

Förbättra förutsägelseprecisionen

Naturligtvis fungerar båda övervägda typer av prognoser ofta tillsammans, till exempel utifrån komplex algoritm de framtida värdena för tidsserien beräknas, och sedan kontrollerar experten dessa siffror för adekvata. I detta skede kan experten göra manuella justeringar, vilket, med tanke på hans höga kvalifikationer, positivt kan påverka kvaliteten på prognosen.

Totalt, om du behöver förbättra noggrannheten i expertprognoser i marknadsföringsuppgifter, måste du direkt följa rekommendationerna i artikeln. Om du står inför uppgiften att förbättra prognosens noggrannhet genom komplexa, snabba, mjukvaruimplementerade matematiska modeller, bör du titta bort, det vill säga en prognos gjord på basis av en uppsättning oberoende prognoser. Snart ska jag prata om konsensusprognos mer information i denna blogg.

1

I en artikel om konkreta exempel olika matematiska metoder för prognoser över tid övervägs, inklusive enkel extrapolering, metoder baserade på tillväxthastigheter och matematisk modellering. Det visas att valet av metod beror på prognosbasen - information för föregående tidsperiod.

prognoser

biostatistik

1. Afanasiev V.N., Yuzbashev M.M. Tidsserieanalys och prognoser: En lärobok. - M.: Finans och statistik, 2001. - 228 sid.

2. Petri A., Sabin K. Visuell statistik i medicin. - M.: GEOTAR-MED, 2003. - 144 sid.

3. Sadovnikova N.A., Shmoylova R.A. Tidsserieanalys och prognos: Handledning. – M.: Ed. Center EAOI, 2001. - 67 sid.

Vanligtvis förstås prognoser som processen att förutsäga framtiden baserat på vissa data från det förflutna, d.v.s. utvecklingen av fenomenet intresse i tid studeras. Sedan betraktas det förutsagda värdet som en funktion av tiden y=f(t) . Men andra typer av prognos övervägs också inom medicinen: en diagnos förutsägs, det diagnostiska värdet av ett nytt test, en förändring av en faktor under påverkan av en annan, etc.

Syftet med artikeln var att presentera olika metoder prognoser och tillvägagångssätt för deras korrekta användning inom medicin.

Forskningsmaterial och metoder

Följande prognosmetoder beaktas i artikeln: enkla extrapoleringsmetoder, glidande medelvärde, exponentiell utjämningsmetod, genomsnittlig absolut tillväxtmetod, metod för genomsnittlig tillväxttakt, prognostiseringsmetoder baserade på matematiska modeller.

Forskningsresultat och diskussion

Som redan noterats baseras prognosen på viss information från det förflutna (prognosbas). Innan du väljer en prognosmetod är det användbart att åtminstone kvalitativt bedöma dynamiken i den studerade kvantiteten under tidigare tidpunkter. De presenterade graferna (Fig. 1) visar att det kan vara annorlunda.

Ris. 1. Exempel på dynamiken i den studerade storheten

I det första fallet (diagram A) observeras relativ stabilitet med små fluktuationer kring medelvärdet. I det andra fallet (graf B) ökar dynamiken linjärt, i det tredje fallet (graf C) är tidsberoendet icke-linjärt, exponentiellt. Det fjärde fallet (diagram D) är ett exempel på komplexa fluktuationer som har flera komponenter.

Den vanligaste kortsiktiga prognosmetoden (1-3 tidsperioder) är extrapolering, som består i att förlänga tidigare mönster in i framtiden. Användningen av extrapolering i prognoser baseras på följande antaganden:

Utvecklingen av fenomenet som studeras i sin helhet beskrivs av en jämn kurva;

Den allmänna trenden i utvecklingen av fenomenet i det förflutna och nuet kommer inte att genomgå några större förändringar i framtiden.

Den första metoden för de enkla extrapoleringsmetoderna är seriemedelmetoden. I denna metod tas den förutsagda nivån av kvantiteten som studeras lika med medelvärdet av nivåerna i serien av denna kvantitet tidigare. Denna metod används if genomsnittlig nivå tenderar inte att förändras, eller så är denna förändring obetydlig (det finns ingen tydligt uttryckt trend, fig. 1, diagram A)

där yprog är den förutsagda nivån av det studerade värdet; yi - värdet på den i:te nivån; n - prognosbas.

På sätt och vis kan segmentet av tidsserien som täcks av observationen liknas vid ett urval, vilket innebär att den resulterande prognosen kommer att vara selektiv, för vilken ett konfidensintervall kan anges

var är standardavvikelsen för tidsserien; tα -Elevens test för en given signifikansnivå och antalet frihetsgrader (n-1).

Exempel. I tabell. 1 visar data för tidsserien y(t). Beräkna det förutsagda värdet av y vid tiden t =13 med hjälp av medelseriemetoden.

bord 1

Tidsseriedata y(t)

(80+98+94+103)/4

(80+98+94+103+84)/5

(80+98+94+103+84+115)/6

(80+98+94+103+84+115+98)/7

(80+98+94+103+84+115+98+113)/8

(80+98+94+103+84+115+98+113+114)/9

(80+98+94+103+84+115+98+113+114+87)/10

(80+98+94+103+84+115+98+113+114+87+107)/11

(80+98+94+103+84+115+98+113+114+87+107+85)/12

Den ursprungliga och utjämnade serien visas i fig. 2, beräkning y - i tabell. 2.

Ris. 2. Inledande och utjämnade serier

Tabell 2

Konfidensintervall för prognos vid tidpunkten t =13

Metoden med glidande medelvärde är en kortsiktig prognosmetod baserad på proceduren för att jämna ut nivåerna för det studerade värdet (filtrering). Övervägande används linjära kantutjämningsfilter med ett intervall m, d.v.s.

.

Konfidensintervall

var är standardavvikelsen för tidsserien; tα - Elevens test för en given signifikansnivå och antalet frihetsgrader (n-1).

Exempel. I tabell. 3 visar data för tidsserien y(t). Beräkna prognosvärdet y vid tiden t =13 med hjälp av metoden med glidande medelvärde med ett utjämningsintervall m=3.

Den ursprungliga och utjämnade serien visas i fig. 3, beräkning y - i tabell. fyra.

Tabell 3

Tidsseriedata y(t)

Ris. 3. Inledande och utjämnade serier

Tabell 4

Prediktivt värde y

Den exponentiella utjämningsmetoden är en metod där värdena från tidigare nivåer, tagna med en viss vikt, används i processen att utjämna varje nivå. När du går bort från en viss nivå minskar vikten av denna observation. Det utjämnade värdet för nivån vid tidpunkten t bestäms av formeln

där St är det nuvarande utjämnade värdet; yt - aktuellt värde för den ursprungliga serien; St - 1 - föregående utjämnade värde; α - utjämningsparameter.

S0 tas lika med det aritmetiska medelvärdet av de första värdena i serien.

För att beräkna α föreslås följande formel

Det finns ingen konsensus om valet av α, detta problem med att optimera modellen har ännu inte lösts. Viss litteratur rekommenderar att man väljer 0,1 ≤ α ≤ 0,3.

Prognosen beräknas enligt följande

.

Konfidensintervall

Tabell 5

Tidsseriedata y(t)

0,3×80+(1-0,3)×90,7

0,3×98+(1-0,3)×87,5

0,3×94+(1-0,3)×90,6

0,3⋅103+(1-0,3)×91,6

0,3×84+(1-0,3)×95

0,3⋅115+(1-0,3)×91,7

0,3×98+(1-0,3)×98,7

0,3⋅113+(1-0,3)×98,5

0,3⋅114+(1-0,3) ⋅102,8

0,3×87+(1-0,3) ⋅106,2

0,3⋅107+(1-0,3) ⋅100,4

0,3×85+(1-0,3) ⋅102,4

97,2+0,3× (85-97,2)

Den ursprungliga och utjämnade serien visas i fig. 4, beräkning y - i tabell. 6.

Ris. 4. Inledande och utjämnade serier

Tabell 6

Prognosvärde y vid tidpunkten t =11

Nästa prognosmetod är metoden för genomsnittlig absolut tillväxt.Den förutsedda nivån på den studerade kvantiteten förändras i enlighet med den genomsnittliga absoluta tillväxten av denna kvantitet tidigare. Denna metod används om den övergripande trenden i dynamiken är linjär (för fallet som visas i fig. 1, diagram B)

var ; y0 - basnivån för extrapolering väljs som medelvärdet av de senaste värdena i den ursprungliga serien; - Genomsnittlig absolut ökning av seriens nivåer; l är antalet prognosintervall.

Medelvärdet för de sista värdena i serien, max tre, tas som basnivå.

Tabell 7

Tidsseriedata y(t)

Prognos = y0+Δl

(60+75+70)/3=68,3

(75+70+103)/3=82,7

(70+103+100)/3=91

(103+100+115)/3=106

(100+115+125)/3=113,3

(115+125+113)/3=117,7

(125+113+138)/3=125,3

(113+138+136)/3=129

(138+136+145)/3=139,7

(136+145+150)/3=143,7

143,7+8,2⋅1=151,9

143,7+8,2⋅2=160,1

143,7+8,2⋅3=168,3

Den ursprungliga och utjämnade serien visas i fig. 5.

Ris. 5. Inledande och utjämnade serier

Metod för genomsnittlig tillväxttakt

Den förväntade nivån på värdet som studeras ändras i enlighet med den genomsnittliga tillväxttakten för detta värde i det förflutna. Denna metod används om den övergripande trenden i dynamik kännetecknas av en exponentiell eller exponentiell kurva (Fig. 1B)

var är den genomsnittliga tillväxttakten tidigare; l är antalet prediktionsintervall.

Den prediktiva uppskattningen kommer att bero på i vilken riktning basnivån y0 avviker från huvudtrenden (trenden), så det rekommenderas att beräkna y0 som ett medelvärde av de senaste värdena i serien.

Tabell 8

Tidsseriedata y(t)

62,5⋅1,081 = 67,7

(70/60)1/2 =1,08

65⋅1,081 = 70,2

(65+70+68)/3=67,7

(68/60)1/3 =1,04

67,7⋅1,041 =70,5

(70+68+82)/3=73,3

(82/60)1/4 =1,08

73,3⋅1,081 =79,3

(68+82+80)/3=76,7

(80/60)1/5 =1,06

76,7⋅1,061 =81,2

(82+80+95)/3=85,7

(95/60)1/6 =1,08

85,7⋅1,081 =92,5

(80+95+113)/3=96

(113/60)1/7 =1,09

96⋅1,091 =105,1

(95+113+135)/3=114,3

(135/60)1/8 =1,11

114,3⋅1,111 =126,5

(113+135+140)/3=129,3

(140/60)1/9 =1,10

129,3⋅1,11 =142,1

(135+140+168)/3=147,7

(168/60)1/10 =1,11

147,7⋅1,111 =163,7

(140+168205)/3=171

(205/60)1/11 =1,12

171⋅1,121 =191,2

171⋅1,122 =213,8

171⋅1,123 =239,1

Den ursprungliga och utjämnade serien visas i fig. 6.

Ris. 6. Inledande och utjämnade serier

Hittills är den vanligaste prognosmetoden att hitta ett analytiskt uttryck (ekvation) för trenden. Trenden för det extrapolerade fenomenet är huvudtrenden i tidsserien, till viss del fri från slumpmässiga influenser.

Utvecklingen av prognosen består i att bestämma typen av extrapolerande funktion y=f(t), som uttrycker det studerade värdets beroende av tid baserat på initialt observerade data. Det första steget är att välja den optimala typen av funktion som ger den bästa beskrivningen av trenden. De mest använda beroenden är:

Linjär ;

parabolisk ;

Exponentiell funktion ;

Problemen med att hitta koefficienterna för en linjär funktion och prognosen baserad på den behandlas i statistikavsnittet "regressionsanalys". Om formen på kurvan som beskriver trenden är icke-linjär, blir uppgiften att uppskatta funktionen y=f(t) mer komplicerad, och i detta fall är det nödvändigt att involvera biostatistiker i analysen och användningen datorprogram om statistisk databehandling.

I de flesta verkliga fall är tidsserien en komplex kurva som kan representeras som summan eller produkten av trendkomponenterna, säsongsbetonade, cykliska och slumpmässiga komponenter.

Trenden är en jämn förändring i processen över tid och beror på inverkan av långsiktiga faktorer. Säsongseffekten är förknippad med närvaron av faktorer som verkar med en förutbestämd periodicitet (till exempel årstider, måncykler). Den cykliska komponenten beskriver långa perioder av relativ uppgång och fall och består av cykler med varierande varaktighet och amplitud (till exempel är vissa epidemier av lång cyklisk karaktär). Seriens slumpmässiga komponent återspeglar inverkan av många slumpmässiga faktorer och kan ha en varierad struktur.

Slutsats

Metoderna för enkel extrapolering, metoden för glidande medelvärden, metoden för exponentiell utjämning är de enklaste och samtidigt de mest ungefärliga - detta kan ses från de breda konfidensintervallen i de givna exemplen. Ett stort prognosfel observeras vid kraftiga nivåfluktuationer. Det bör noteras att det är olagligt att använda dessa metoder om det finns en tydlig uppåtgående (eller nedåtgående) trend i den inledande tidsserien. Icke desto mindre är användningen motiverad för kortsiktiga prognoser.

Analysen av alla komponenter i tidsserien och prognoser baserade på dem är inte en trivial uppgift, den beaktas i statistikavsnittet "tidsserieanalys" och kräver särskild utbildning.

Bibliografisk länk

Koichubekov B.K., Sorokina M.A., Mkhitaryan K.E. MATEMATISKA METODER FÖR PROGNOS INOM MEDICIN // Uspekhi modern naturvetenskap. - 2014. - Nr 4. - P. 29-36;
URL: http://natural-sciences.ru/ru/article/view?id=33316 (åtkomstdatum: 2019/03/30). Vi uppmärksammar dig på tidskrifterna publicerade av förlaget "Academy of Natural History" 23 april 2013 kl. 11:08

Klassificering av prognosmetoder och modeller

  • Matte
  • handledning

Jag har gjort tidsserieprognoser i över 5 år. Förra året disputerade jag på ämnet " Tidsserieprognosmodell från Maximum Similarity Sample”, men efter försvaret var det en del frågor kvar. Här är en av dem - allmän klassificering av prognosmetoder och modeller.


Vanligtvis, i verk av både inhemska och engelsktalande författare, ställer de sig inte frågan om klassificeringen av prognosmetoder och modeller, utan listar dem helt enkelt. Men det verkar för mig att detta område idag har vuxit och expanderat så mycket att även den mest allmänna, men klassificering är nödvändig. Nedan är min egen version av den allmänna klassificeringen.

Vad är skillnaden mellan en prognosmetod och en modell?

Förutsägelsemetod representerar en sekvens av åtgärder som måste utföras för att erhålla en prognosmodell. I analogi med matlagning är en metod en sekvens av åtgärder enligt vilka en maträtt tillagas - det vill säga en prognos görs.


Förutsägelsemodellär en funktionell representation som adekvat beskriver den process som studeras och som ligger till grund för att erhålla dess framtida värden. I samma kulinariska analogi har modellen en lista över ingredienser och deras förhållande, vilket är nödvändigt för vår maträtt - en prognos.


Kombinationen av metod och modell bildar ett komplett recept!



Det är numera brukligt att använda engelska förkortningar för namn på både modeller och metoder. Det finns till exempel känd modell prediktiv autoregression av det givna integrerade glidande medelvärdet yttre faktor(automatisk regression integrerat glidande medelvärde utökat, ARIMAX). Denna modell och dess motsvarande metod brukar kallas ARIMAX, och ibland Box-Jenkins modellen (metoden) efter författarna.

Först klassificerar vi metoderna

Om man tittar noga blir det snabbt tydligt att begreppet " prognosmetoden"mycket bredare begrepp" prediktiv modell". I detta avseende, i det första steget av klassificeringen, delas metoder vanligtvis in i två grupper: intuitiva och formaliserade.



Om vi ​​minns vår kulinariska analogi, så kan vi även där dela upp alla recept i formaliserade, det vill säga nedskrivna av antalet ingredienser och beredningsmetoden, och intuitiva, det vill säga inte registreras någonstans och erhållna från erfarenheten av den kulinariska specialisten. När använder vi inte ett recept? När rätten är väldigt enkel: stek potatis eller koka dumplings, du behöver inget recept. När annars använder vi inte receptet? När vi vill uppfinna något nytt!


Intuitiva prognosmetoder behandla experters bedömningar och bedömningar. Hittills används de ofta inom marknadsföring, ekonomi, politik, eftersom systemet, vars beteende måste förutsägas, antingen är mycket komplext och inte kan beskrivas matematiskt, eller väldigt enkelt och inte behöver en sådan beskrivning. Detaljer om sådana metoder finns i.


Formaliserade metoder- prognosmetoder som beskrivs i litteraturen, som ett resultat av vilka prognosmodeller byggs, det vill säga de bestämmer ett sådant matematiskt beroende som gör att du kan beräkna det framtida värdet av processen, det vill säga göra en prognos.


På detta kan den allmänna klassificeringen av prognosmetoder enligt min mening kompletteras.

Därefter gör vi en allmän klassificering av modeller

Här är det nödvändigt att gå vidare till klassificeringen av prognosmodeller. I det första skedet bör modellerna delas in i två grupper: domänmodeller och tidsseriemodeller.




Domänmodeller- sådan matematiska modeller prognostisering, för vars konstruktion ämnesområdets lagar används. Till exempel innehåller en modell som används för att göra en väderprognos ekvationerna för vätskedynamik och termodynamik. Prognosen för befolkningsutvecklingen görs på en modell byggd på en differentialekvation. Förutsägelsen av blodsockernivån hos en person med diabetes görs på basis av ett system av differentialekvationer. Kort sagt, sådana modeller använder beroenden som är specifika för ett visst ämnesområde. Dessa typer av modeller är individuellt förhållningssätt under utveckling.


Tidsseriemodeller- matematiska prognosmodeller som söker hitta det framtida värdets beroende av det förflutna inom själva processen och beräkna prognosen på detta beroende. Dessa modeller är universella för olika ämnesområden, det vill säga deras allmänna form förändras inte beroende på tidsseriernas karaktär. Vi kan använda neurala nätverk för att förutsäga lufttemperatur och sedan tillämpa en liknande modell på neurala nätverk för att förutsäga aktieindex. Dessa är generaliserade modeller, som kokande vatten, i vilka om du kastar en produkt, kommer den att koka, oavsett dess natur.

Klassificering av tidsseriemodeller

Det verkar för mig att komponera allmänna klassificeringen domänmodeller är inte möjligt: ​​hur många områden, så många modeller! Tidsseriemodeller lämpar sig dock lätt för enkel uppdelning. Tidsseriemodeller kan delas in i två grupper: statistiska och strukturella.




statistiska modeller det framtida värdets beroende av det förflutna ges i form av någon ekvation. Dessa inkluderar:

  1. regressionsmodeller (linjär regression, icke-linjär regression);
  2. autoregressiva modeller (ARIMAX, GARCH, ARDLM);
  3. exponentiell utjämningsmodell;
  4. modell baserad på det maximala likhetsprovet;
  5. etc.

strukturella modeller det framtida värdets beroende av det förflutna ges i form av en viss struktur och regler för att röra sig längs det. Dessa inkluderar:

  1. neurala nätverksmodeller;
  2. modeller baserade på Markov-kedjor;
  3. modeller baserade på klassificerings-regressionsträd;
  4. etc.

För båda grupperna har jag angett de huvudsakliga, det vill säga de vanligaste och mest detaljerade prognosmodellerna. Men idag finns det redan ett stort antal tidsserieprognosmodeller, och för att göra prognoser har till exempel SVM-modeller (support vector machine), GA-modeller (genetisk algoritm) och många andra börjat användas.

Allmänna klassificeringen

Därmed fick vi följande klassificering av modeller och prognosmetoder.




  1. Tikhonov E.E. Prognoser i marknadsförhållanden. Nevinnomyssk, 2006. 221 sid.
  2. Armstrong J.S. Prognos för marknadsföring // Kvantitativa metoder inom marknadsföring. London: International Thompson Business Press, 1999, s. 92–119.
  3. Jingfei Yang M. Sc. Power System Kortsiktig lastprognoser: Examensarbete för doktorsexamen. Tyskland, Darmstadt, Elektrotechnik und Informationstechnik der Technischen Universitat, 2006. 139 sid.
UPD. 2016-11-15.
Mina herrar, det har nått vansinne! Nyligen fick jag en artikel för VAK-upplagan med en länk till detta inlägg för granskning. Jag uppmärksammar er på det faktum att varken i diplom, eller i artiklar, och ännu mer i avhandlingar kan inte länka till bloggen! Om du vill ha en länk använd denna: Chuchueva I.A. MODELL FÖR FÖRUTSÄTTNING AV TIDSERIEN OM VAL AV MAXIMAL LIKHET, avhandling... cand. de där. Vetenskaper / Moscow State Technical University. N.E. Bauman. Moskva, 2012.

Bilaga 1. METODER FÖR STATISTISK ANALYS OCH PROGNOSER I AFFÄRER

4. Matematiska prognosverktyg

Matematiska metoder och modeller som används i problemen med stokastisk analys och prognoser i näringslivet kan relatera till en mängd olika områden av matematik: regressionsanalys, tidsserieanalys, bildande och utvärdering av expertutlåtanden, simuleringsmodellering, system av samtidiga ekvationer, diskriminantanalys, logit- och probitmodeller, apparaten för logiska beslutsfunktioner, analys av varians eller kovarians, analys av rangkorrelationer och beredskapstabeller, etc. Alla förenas dock av det faktum att de representerar olika tillvägagångssätt för att lösa de centrala problemen med multivariat statistisk analys och ekonometri – problem med statistiska studier av beroenden, vilket är bara grundläggande problem med statistisk analys och prognoser i näringslivet (dess allmänna formulering gavs i punkt 2).

Redan i punkt 1 noterades att bland p+k+l+m Komponenterna i det analyserade flerdimensionella särdraget kan vara både kvantitativa och ordinala och nominella variabler. De metoder som nämnts ovan för att lösa det centrala problemet med multivariat statistisk analys utformades med hänsyn till arten av de variabler som studeras. Motsvarande specialisering av dessa tillvägagångssätt återspeglas i tabell. 4. Den innehåller också referenser till litterära källor där man kan hitta tillräckligt Full beskrivning dessa tillvägagångssätt.

Tabell 4

Typen av de resulterande indikatorerna

Förklaringsvariablernas karaktär

Namnet på tjänstesektionerna i multivariat statistisk analys

Litterära källor

kvantitativ

kvantitativ

Regressionsanalys och system av samtidiga ekvationer

kvantitativ

Den enda kvantitativa variabeln tolkad som "tid"

Tidsserieanalys

kvantitativ

Icke kvantitativa (ordinala eller nominella variabler)

Variansanalys

kvantitativ

Analys av kovarians, typologiska regressionsmodeller

Icke kvantitativa (ordinala variabler)

Icke kvantitativa (ordinala och nominella variabler)

Analys av rangkorrelationer och beredskapstabeller

Icke-kvantitativ (nominella variabler)

kvantitativ

Diskriminantanalys, logit- och probitmodeller, klusteranalys, taxonomi, uppdelning av blandningar av distributioner

Blandade (kvantitativa och icke-kvantitativa variabler)

Blandade (kvantitativa och icke-kvantitativa variabler)

Apparaten är logisk avgörande funktioner, Data Mining

Ändå visar praktiken av statistisk analys och prognoser i näringslivet att i hela spektrumet av deras matematiska verktyg hör det obestridda ledarskapet (när det gäller prevalens och relevans) till tre sektioner:
- regressionsanalys;
-
tidsserieanalys;
-
mekanismen för bildande och statistisk analys av expertbedömningar.

Låt oss kort titta på var och en av dessa avsnitt.

Regressionsanalys

Som tidigare kommer vi att beskriva funktionen hos det verkliga objektet som studeras (företag, företag, produktionsprocess eller produktdistribution, etc.) med en uppsättning variabler och (deras meningsfulla betydelse beskrivs i punkt 2). Låt oss introducera ett antal definitioner och begrepp som används i regressionsanalys.

Resulterande (beroende, endogena) variabler. Variabeln som kännetecknar resultatet eller effektiviteten av det analyserade systemet kallas det resulterande (beroende, endogena). Dess värden bildas under och inom detta systems funktion under påverkan av ett antal andra variabler och faktorer, av vilka några kan registreras och, i viss utsträckning, hanteras och planeras (denna del kallas vanligtvis förklarande variabler , se nedan). I regressionsanalys fungerar den resulterande variabeln som en funktion, vars värden bestäms (men med något slumpmässigt fel) av värdena för de ovan nämnda förklarande variablerna som fungerar som argument. Därför är den resulterande variabeln till sin natur alltid stokastisk (slumpmässig). I det allmänna fallet analyseras vanligtvis beteendet hos flera resulterande variabler .

Förklarande (prediktor, exogena) variabler . Variabler (eller tecken) som kan registreras, som beskriver villkoren för funktionen av det realekonomiska systemet som studeras och i stor utsträckning bestämmer processen för att bilda värdena för de resulterande variablerna, kallas förklarande. Som regel lämpar sig vissa av dem för åtminstone partiell reglering och förvaltning. Värdena för ett antal förklarande variabler kan ställas in som "utanför" det analyserade systemet. I det här fallet kallas de exogena. I regressionsanalys spelar de rollen som argument för funktionen, som betraktas som den analyserade resulterande indikatorn. Till sin natur kan förklaringsvariabler vara antingen slumpmässiga eller icke-slumpmässiga.

Regressionsrester- dessa är latenta (d.v.s. dolda, inte mottagliga för direkt mätning) slumpmässiga komponenter, som återspeglar inverkan på respektive inte beaktas vid sammansättningen av faktorer, samt slumpmässiga fel vid mätningen av de analyserade resulterande variablerna. Generellt sett kan de också bero på , d.v.s. i det allmänna fallet .

Allmänt schema interaktionen mellan variabler i regressionsanalys visas i figuren.




Bild . Allmänt schema för interaktion av variabler i regressionsanalys.

regressionsfunktion . Funktionen kallas regressionsfunktion av (eller bara - regression ) om den beskriver förändringen i det villkorliga medelvärdet för den resulterande variabeln (förutsatt att värdena för de förklarande variablerna är fasta på nivåer) beroende på förändringen i värdena för de förklarande variablerna. Följaktligen, matematiskt, kan denna definition skrivas som

där symbolen betyder operationen av teoretisk medelvärdesberäkning av värden (dvs. är den matematiska förväntan av en slumpvariabel, och, eller helt enkelt är den villkorliga matematiska förväntan av en slumpmässig variabel, beräknad under förutsättning att värdena för den förklarande variabler är fasta på nivån ).

Om vi ​​analyserar de resulterande variablerna samtidigt, bör vi överväga respektive regressionsfunktioner eller, som är densamma, en vektorvärderad fungera

. (11)

Sedan regressionsmodellen kan skrivas i formen

, (12)

dessutom följer det av definitionen att alltid]

(12’)

(identisk likhetstecknet i (12') betyder att det gäller för några värden; kolumnvektorn med nollor på höger sida har dimension ).

regressionsproblem i själva allmän syn kan formuleras enligt följande:

enligt mätresultaten

av variablerna som studeras på objekten (system, processer) i den analyserade populationen, konstruera en sådan (vektorvärderad) funktion (11) som skulle tillåta det bästa (i viss mening) sättet att återställa värdena för resulterande (förutspådda) variabler genom givna värden för förklarande (exogena) variabler.

Anmärkning 1. De vanligaste är linjär regressionsmodeller, dvs modeller där regressionsfunktionerna har en linjär form:

Anmärkning 2. Det finns minst två alternativ för att tolka de "beteende-", "status"- och "externa" variablerna som introducerades i avsnitt 2 respektive inom ramen för den beskrivna regressionsmodellen (12)–(12 '). I den första varianten alla tre typerna variabler och hänvisa till förklarande variabler och bygg en regression på . I en annan variant tolkas variablerna och som observationsförhållanden och då separat för varje fast kombination av dessa villkor byggs en regressionsmodell av formen (12) (inom ramen för en linjär modell (12 ''), detta kommer att innebära att själva regressionskoefficienterna beror på och , det vill säga de definieras som funktioner av och ).

Tidsserieanalys

Eventuella statistiska analyser och prognoser baseras på de initiala statistiska uppgifterna. Deras huvudtyper presenterades i punkt 1. Samtidigt, om processen för dataregistrering sker i tid och själva tiden är fixerad tillsammans med värdena för de analyserade egenskaperna, talar man om en statistisk analys av så kallade paneldata. Om vi ​​fixar variabelnumret och numret på det statistiskt undersökta objektet så ligger det i kronologisk ordning sekvens av värden

kallad endimensionella tidsserier. Om vi ​​emellertid samtidigt betraktar endimensionella tidsserier av formen (13), d.v.s. undersöker mönstren i sammankopplade beteende av tidsserier (13) för , karakterisering av dynamiken hos variabler, mätt på någon(-m) objekt, då pratar de om Statistisk analys multivariata tidsserier. I huvudsak innebär alla uppgifter relaterade till analys av ekonomisk dynamik och prognoser användning av tidsserier för vissa indikatorer som deras statistiska bas.

Som regel, i uppgifterna för affärsprognoser, endast diskret (efter observationstid) endimensionella tidsserier för lika fördelade observationsmoment, d.v.s. var är en given tidsperiod (minut, timme, dag, vecka, månad, kvartal, år, etc.). I dessa fall kommer det att vara bekvämare för oss att representera tidsserien som studeras i formuläret

var är värdet på den analyserade indikatorn, registrerad i det e tidssteget .

På tal om användningen av apparaten för tidsserieanalys i problemet med prognoser, menar vi i korthet- och medellång sikt prognos, eftersom konstruktionen långsiktigt prognos innebär obligatorisk användning av metoder för organisation och statistisk analys särskilda expertbedömningar.

Uppkomst av observationer som bildar tidsserien. Det handlar om om strukturen och klassificeringen av huvudfaktorerna under påverkan av vilka värdena för elementen i tidsserien bildas. Det är tillrådligt att särskilja följande fyra typer av sådana faktorer.

(MEN) långsiktigt bildar en allmän (på lång sikt) trend i förändringen av den analyserade egenskapen. Vanligtvis beskrivs denna trend med en eller annan icke-slumpmässig funktion f tr (t), vanligtvis monotont. Denna funktion kallas trendfunktion eller bara trend.

(B) Säsong, som bildar fluktuationer av den analyserade egenskapen som periodiskt upprepas vid en viss tid på året. Låt oss komma överens om att beteckna resultatet av verkan av säsongsfaktorer med hjälp av en icke-slumpmässig funktion . Eftersom denna funktion borde vara periodisk(med perioder som är multiplar av årstider, d.v.s. fjärdedelar), deltar övertoner (trigonometriska funktioner) i dess analytiska uttryck, vars frekvens som regel bestäms av problemets innehåll.

(PÅ) Cyklisk (opportunistisk) som bildar förändringar i den analyserade egenskapen, på grund av verkan av långtidscykler av ekonomisk, demografisk eller astrofysisk karaktär (Kondratiev-vågor, demografiska "hål", cykler av solaktivitet, etc.). Resultatet av verkan av cykliska faktorer kommer att betecknas med en icke-slumpmässig funktion.

(G) Slumpmässig(oregelbunden), inte mottaglig för redovisning och registrering. Deras inverkan på bildandet av värdena för tidsserien avgör bara stokastisk natur element, och därmed behovet av tolkning som observationer gjorda på slumpvariabler, respektive. Vi kommer att beteckna resultatet av inverkan av slumpmässiga faktorer med hjälp av slumpmässiga variabler("rester", "fel"). Naturligtvis är det inte alls nödvändigt att faktorer samtidigt deltar i processen att bilda värden för någon tidsserie. Allt fyra typer. I vissa fall kan tidsseriens värden bildas under inverkan av faktorerna (A), (B) och (D), i andra - under inverkan av faktorerna (A), (C) och (D) ) och slutligen uteslutande under påverkan av enbart faktorer, slumpmässiga faktorer (D). Dock i alla fall slumpmässigt oumbärligt deltagande (evolutionär) faktorer (D). Dessutom är det allmänt accepterat (som en hypotes) tillsats strukturell schema påverkan av faktorerna (A), (B), (C) och (D) på bildandet av värden, vilket innebär legitimiteten att representera värdena för medlemmarna i tidsserien i form av nedbrytning:

Slutsatser om huruvida faktorer är inblandade eller inte av denna typ i bildandet av värderingar, kan baseras både på analysen av uppgiftens innehåll (dvs. a priori expert på natur), och på en speciell statistisk analys av den studerade tidsserien.

Inom ramen för de introducerade begreppen och notationen tidsseriestatistisk analysproblem i allmänhet kan formuleras enligt följande:

konstruera de bästa (i viss mening) uppskattningarna för expansionsvillkoren baserat på resultaten av mätningar av den studerade variabeln för basperiodens tidsintervall (14).

Lösningen på detta problem används för att konstruera ett förutsägande värde för tidstick framåt med hjälp av formel (14) med och när de erhållna uppskattningarna av komponenterna på höger sida av nedbrytningen ersätts i den.

Bildningsmekanismer och statistisk analys av expertbedömningar

Vanligtvis särskiljs följande huvudtyper av organisation av arbetet i en expertgrupp ():

· kollegialt: ”kommissionsmetod” (i form av en öppen diskussion om det aktuella problemet); "domstolsmetod" (i form av konfrontation mellan "försvar" och "avgift" för vart och ett av alternativen för den diskuterade lösningen på problemet); "brainstorming", etc.;

· delvis kollegialt: scenarioanalys av typen "vad-om", "Delphi" -metoden - en diskussion i flera omgångar av problemet med hemlig omröstning av experter eller fylla i särskilda anonyma frågeformulär i slutet av varje omgång och arbetet i en oberoende analytisk grupp mellan varven osv.;

· individuellt självständig: var och en av medlemmarna i expertgruppen bildar och uttrycker sin åsikt (oavsett andra deltagares positioner) i form av att rangordna de diskuterade lösningarna (eller objekten), deras parade jämförelser eller tilldela var och en av dem till en av de tidigare beskrivna graderingarna (se formulär för att presentera initiala statistiska data i form av frekvenstabeller eller oförutsedda tabeller mellan yttrandena från de -e och -e experterna mäts med värdet , där är Spearmans rankkorrelationskoefficient (se kap. 11]) Vi kan sedan lösa problemet med "klustring" av experter, genom att tolka vart och ett av de kluster som finns på detta sätt som en grupp likasinnade experter.

ii) Analys av expertgruppens ömsesidiga överenskommelser. Med åsikter från en hel grupp experter försöker statistikern att bedöma graden av konsistens av alla dessa expertbedömningar, inklusive statistiskt testning av hypotesen om den fullständiga avsaknaden av överensstämmelse (och då bör man naturligtvis antingen förtydliga formuleringen av det problem som föreslagits av experterna, eller ändra expertgruppen för sammansättning). Detta problem löses också med hjälp av multivariat statistisk analys. Valet av en specifik metod beror på formen på de initiala statistiska uppgifterna. Till exempel, om experternas åsikter representeras av rankningar, kan man som ett mått på deras konsistens överväga objektkoefficient), dvs. med initiala statistiska data av formuläret definieras som en lösning på ett optimeringsproblem av formuläret j- Experten är längre bort från den enhetliga gruppuppfattningen, ju lägre nivån på hans relativa kompetens uppskattas. Observera att om statistikern, som ett resultat av att studera strukturen för helheten av expertutlåtanden, kommer till slutsatsen att flera undergrupper av experter med homogenitet av åsikter inom varje undergrupp och med en betydande skillnad i åsikter i valfritt par av sådana undergrupper, då löses uppgiften med ett enda grupputlåtande och en bedömning av den relativa kompetensen hos en expert separat för var och en av de identifierade undergrupperna.


Slumpmässiga faktorer kan i sin tur vara av dubbel karaktär: plötslig("störning"), vilket leder till plötsliga strukturella förändringar i mekanismen för bildandet av värden x(t)(vilket uttrycks till exempel i radikala krampaktiga förändringar i funktionernas grundläggande strukturella egenskaper f tr(t), j(t) och y(t) analyserade tidsserier vid en slumpmässig tidpunkt), och evolutionär rest, vilket orsakar relativt små slumpmässiga avvikelser av värdena x(t) från de som borde ha varit under påverkan av faktorer (A), (B) och (C). Men i det här avsnittet kommer vi att överväga scheman för bildandet av tidsserier, inklusive åtgärden bara evolutionärt återstående slumpmässiga faktorer.

Tidigare
Läser in...Läser in...