Forhold Til Moving Average Metoden I Utmerker Seg
Flytende gjennomsnitt. Dette eksemplet lærer deg hvordan du beregner det bevegelige gjennomsnittet av en tidsserie i Excel. Et glidende gjennomsnitt brukes til å utjevne uregelmessigheter topper og daler for å enkelt gjenkjenne trender. Først, la oss ta en titt på vår tidsserier.2 På Data-fanen klikker du Data Analysis. Note kan ikke finne Data Analysis-knappen Klikk her for å laste Analysis ToolPak-tillegget.3 Velg Flytt gjennomsnitt og klikk OK.4 Klikk i feltet Innmatingsområde og velg området B2 M2. 5 Klikk i intervallboksen og skriv inn 6.6 Klikk i feltet Utmatingsområde og velg celle B3.8 Skriv en graf av disse verdiene. Eksplosjon fordi vi angir intervallet til 6, er glidende gjennomsnitt gjennomsnittet for de forrige 5 datapunktene og det nåværende datapunktet Som et resultat, blir tømmer og daler utjevnet Grafen viser en økende trend Excel kan ikke beregne det bevegelige gjennomsnittet for de første 5 datapunktene fordi det ikke er nok tidligere datapunkter.9 Gjenta trinn 2 til 8 for intervall 2 og intervall 4. Konklusjon La rger intervallet, jo flere toppene og dalene blir utjevnet. Jo mindre intervallet, desto nærmere er de bevegelige gjennomsnittene til de faktiske datapunktene. Når du beregner et løpende bevegelige gjennomsnitt, er det fornuftig å plassere gjennomsnittet i mellomtiden. forrige eksempel beregner vi gjennomsnittet av de første 3 tidsperiodene og plasserte det ved siden av periode 3 Vi kunne ha plassert gjennomsnittet midt i tidsintervallet på tre perioder, det vil si ved siden av periode 2 Dette fungerer bra med ulige tidsperioder , men ikke så bra for like tidsperioder Så hvor ville vi plassere det første glidende gjennomsnittet når M 4. Teknisk sett ville det bevegelige gjennomsnittet falle på t 2 5, 3 5. For å unngå dette problemet glattes MAs-ene ved å bruke M 2 vi jevne ut glatte verdier. Hvis vi gjennomsnittlig et jevnt antall vilkår, må vi glatte de glatte verdiene. Følgende tabell viser resultatene ved å bruke M 4.Spreadsheet implementering av sesongjustering og eksponensiell utjevning. Det er greit å utføre sesongjusteringer ent og passe eksponentielle utjevningsmodeller ved hjelp av Excel Skjermbilder og diagrammer nedenfor er hentet fra et regneark som er satt opp for å illustrere multiplikativ sesongjustering og lineær eksponensiell utjevning på følgende kvartalsvise salgsdata fra Outboard Marine. For å få en kopi av regnearket filen selv, klikk her Versjonen av lineær eksponensiell utjevning som skal brukes her for demonstrasjonsformål er Browns versjon, bare fordi den kan implementeres med en enkelt kolonne med formler og det er bare en utjevningskonstant for å optimalisere. Det er vanligvis bedre. å bruke Holt s versjon som har separate utjevningskonstanter for nivå og trend. Prognoseprosessen fortsetter som følger: Først blir dataene sesongjustert ii, da prognoser genereres for sesongjusterte data via lineær eksponensiell utjevning og endelig er de sesongjusterte prognosene resesasonalized for å få prognoser for den opprinnelige serien Sesongjusteringen prosessen utføres i kolonne D til G. Det første trinnet i sesongjustering er å beregne et sentrert glidende gjennomsnitt som utføres her i kolonne D Dette kan gjøres ved å ta gjennomsnittet av to ettårige gjennomsnitt som kompenseres av en periode i forhold til hverandre En kombinasjon av to offset gjennomsnitt i stedet for et enkelt gjennomsnitt er nødvendig for sentreringsformål når antall sesonger er like. Det neste trinnet er å beregne forholdet til glidende gjennomsnitt - de opprinnelige dataene delt med glidende gjennomsnitt i hver periode - som utføres her i kolonne E Dette kalles også trend-syklus-komponenten i mønsteret, forutsatt at trend - og konjunktursykluser kan anses å være alt som gjenstår etter gjennomsnitt over et helt års verdier av data Selvfølgelig kan endringer fra måned til måned som ikke skyldes sesongbestemte, bestemmes av mange andre faktorer, men gjennomsnittet på 12 måneder glatter over dem i stor grad. Den estimerte sesongindeksen for hver sesong beregnes av f første gjennomsnittlige forholdene for den spesielle sesongen, som er gjort i celler G3-G6 ved hjelp av en AVERAGEIF-formel. Gjennomsnittstallene blir deretter rescaled slik at de beløper seg til nøyaktig 100 ganger antall perioder i en sesong, eller 400 i dette tilfellet, som er gjort i celler H3-H6 Under kolonne F, brukes VLOOKUP formler til å sette inn riktig sesongindeksverdi i hver rad av datatabellen, i henhold til kvartalet representerer det Sentrert glidende gjennomsnitt og sesongjusterte data Enda se slik ut. Merk at det bevegelige gjennomsnittet vanligvis ser ut som en jevnere versjon av den sesongjusterte serien, og den er kortere i begge ender. Et annet regneark i samme Excel-fil viser anvendelsen av den lineære eksponensielle utjevningsmodellen til sesongmessig justerte data, som begynner i kolonne GA-verdien for utjevningskonstanten alfa, er angitt over prognosen kolonnen her, i celle H9 og for enkelhets skyld blir det tildelt rekkevidde-navnet Alpha Navnet er tildelt bruker kommandoen Sett inn navnnavn LES-modellen blir initialisert ved å sette de to første prognosene tilsvarer den første virkelige verdien av sesongjusterte seriene. Formelen brukt her for LES-prognosen, er rekursiv form for enlig-likning av Brown s-modellen. Denne formelen er oppgitt i cellen som svarer til den tredje perioden her, celle H15 og kopieres derfra Merk at LES-prognosen for den nåværende perioden refererer til de to foregående observasjonene og de to foregående prognosefeilene, samt til verdien av alfa Således , forutsigelsesformelen i rad 15 refererer bare til data som var tilgjengelige i rad 14 og tidligere. Selvfølgelig, hvis vi ønsket å bruke enkle i stedet for lineær eksponensiell utjevning, kunne vi erstatte SES-formelen her i stedet. Vi kunne også bruke Holt s heller enn Brown s LES-modellen, som ville kreve to flere kolonner med formler for å beregne nivået og trenden som brukes i prognosen. Feilene beregnes i den neste kolonnen her, kolonne J ved å trekke prognosene fra de faktiske verdiene Rutenes middelkvadratfeil beregnes som kvadratroten av feilenes variasjon pluss kvadratet av gjennomsnittet Dette følger av den matematiske identiteten MSE VARIANCE-feil AVERAGE-feil 2 Ved beregning av middel og varians av feilene i denne formelen er de to første perioder ekskludert fordi modellen ikke faktisk begynner prognoser før tredje periode rad 15 på regnearket. Den optimale verdien av alfa kan bli funnet enten ved å endre alfa manuelt til minimum RMSE er funnet, eller ellers kan du bruke Solver til å utføre en nøyaktig minimering. Verdien av alfa som Solver funnet er vist her alpha 0 471. Det er vanligvis en god ide å plotte feilene i modellen i transformerte enheter og også å beregne og plotte sine autokorrelasjoner ved lags på opptil en sesong Her er en tidsserie av de sesongjusterte feilene. Feilautokorrelasjonene beregnes ved å bruke CORREL-funksjonen for å beregne co sammenhenger av feilene med seg selv forsinket av en eller flere perioder - detaljer er vist i regnearkmodellen Her er et plott av autokorrelasjonene av feilene ved de første fem lagene. Autokorrelasjonene på lags 1 til 3 er svært nær null, men spissen ved lag 4, hvis verdi er 0 35, er litt plagsom - det antyder at sesongjusteringsprosessen ikke har vært helt vellykket. Det er imidlertid bare marginalt signifikant 95 signifikansbånd for å teste om autokorrelasjoner er signifikant forskjellig fra null, er grovt pluss-eller-minus 2 SQRT nk, hvor n er prøvestørrelsen og k er lagret Her er n 38 og k varierer fra 1 til 5, slik at kvadratroten-av-n-minus-k er rundt 6 for alle av dem, og dermed er grensene for å teste den statistiske signifikansen av avvik fra null, omtrent pluss-eller-minus 2 6 eller 0 33 Hvis du varierer verdien av alpha for hånd i denne Excel-modellen, kan du observere effekten på tidsserier og autokorrelasjonsplaner av e rupser, samt roten-middelkvadratfeilen, som vil bli illustrert nedenfor. På bunnen av regnearket blir prognoseformelen oppstartet inn i fremtiden ved bare å erstatte prognoser for faktiske verdier på det punktet der de faktiske dataene går ut - dvs. hvor fremtiden begynner Med andre ord, i hver celle der en fremtidig dataværdi vil oppstå, settes en cellereferanse som peker på prognosen som er laget for den perioden. Alle de andre formlene kopieres ganske enkelt nedfra. feilene for fremtidsutsikter er alle beregnet til å være null Dette betyr ikke at de faktiske feilene vil være null, men det reflekterer bare det faktum at vi forutsetter at fremtidige data vil svare til prognosene i gjennomsnitt. resulterende LES-prognoser for de sesongjusterte dataene ser slik ut. Med denne spesielle verdien av alfa, som er optimal for prognoser med en periode fremover, er den prognostiserte trenden litt oppover, noe som gjenspeiler lokal t rend som ble observert i løpet av de siste 2 årene eller så For andre verdier av alfa kan det oppnås en helt annen trendprojeksjon. Det er vanligvis en god ide å se hva som skjer med den langsiktige trendprojeksjonen når alfa er variert, fordi verdien det som er best for kortsiktig prognose vil ikke nødvendigvis være den beste verdien for å forutsi den lengre fremtid. For eksempel er her resultatet som oppnås hvis verdien av alfa er manuelt satt til 0 25. Den projiserte langsiktige trenden er nå negativ i stedet for positiv Med en mindre verdi av alfa, legger modellen vekt på eldre data i sin estimering av dagens nivå og trend, og langsiktige prognosene reflekterer den nedadgående trenden observert de siste 5 årene i stedet for nyere oppadgående trend Dette diagrammet illustrerer også klart hvordan modellen med en mindre verdi av alfa er langsommere for å svare på vendepunkter i dataene og derfor har en tendens til å gjøre en feil av det samme tegn i mange perioder på rad. 1-trinns prognosefeil er større i gjennomsnitt enn de som er oppnådd før RMSE av 34 4 i stedet for 27 4 og sterkt positivt autokorrelert Lag-1 autokorrelasjonen på 0 56 overstiger i stor grad verdien av 0 33 beregnet ovenfor for en statistisk signifikant avvik fra null Som et alternativ til å svekke verdien av alpha for å introdusere mer konservatisme i langsiktige prognoser, blir det noen ganger lagt en trend-dempningsfaktor til modellen for å gjøre den projiserte trenden flatt ut etter noen få sekunder. Det siste trinnet i å bygge prognosemodellen er å reasonalize LES prognosene ved å multiplisere dem med de riktige sesongbestemte indeksene. Derfor er de resesasonaliserte prognosene i kolonne I ganske enkelt produktet av sesongindeksene i kolonne F og de sesongjusterte LES-prognosene i kolonne H. Det er relativt enkelt å beregne konfidensintervall for en-trinns prognoser laget av denne modellen, beregner du først RMSE root-mean-squared-feilen, som er bare s quare root av MSE og deretter beregne et konfidensintervall for sesongjustert prognose ved å legge til og trekke to ganger RMSE Generelt er et 95 konfidensintervall for en prognose for en periode frem til omtrent lik poengprognosen pluss-eller-minus - to ganger den estimerte standardavviket for prognosefeilene, forutsatt at feilfordelingen er omtrent normal og prøven er stor nok, si 20 eller mer. Her er RMSE i stedet for prøve standardavviket av feilene det beste estimatet av feilene. standardavviket for fremtidige prognosefeil fordi det også tar hensyn til tilfeldige variasjoner. Tillitsgrensene for den sesongjusterte prognosen blir deretter resesasonalized sammen med prognosen, ved å multiplisere dem med de riktige sesongindeksene. I dette tilfellet er RMSE lik 27 4 og sesongjustert prognose for første periode i desember 93-tallet er 273 2, slik at det sesongjusterte 95 konfidensintervallet er fra 273 2-2 27 4 218 4 til 273 2 2 27 4 328 0 Multiplisere disse grensene innen desember s sesongindeks på 68 61 vi oppnår lavere og øvre konfidensgrenser på 149 8 og 225 0 rundt 93-punktsprognosene for 187 4.Forholdsgrenser for prognoser mer enn en periode fremover, vil det generelt øke som prognosenes horisont øker på grunn av usikkerhet om nivå og trend, samt sesongfaktorer, men det er vanskelig å beregne dem generelt ved hjelp av analytiske metoder. Den rette måten å beregne konfidensgrenser for LES prognosen er ved å bruke ARIMA-teorien, men usikkerheten i sesongindeksene er en annen sak. Hvis du vil ha et realistisk konfidensintervall for en prognose mer enn en periode framover, tar du hensyn til alle feilkilder, din beste innsats er å bruke empiriske metoder for For eksempel, for å oppnå et konfidensintervall for en 2-trinns prognose, kan du opprette en annen kolonne på regnearket for å beregne en 2-trinns prognose for hver periode ved å starte opp en gang for å omarbeide Beregn deretter RMSE for 2-trinns prognosefeilene og bruk dette som grunnlag for et 2-trinns konfidensintervall.
Comments
Post a Comment