Saturday 7 October 2017

Ved Hjelp Av Forholdet Til Bevegelig Gjennomsnitt Metode Bestemme The Kvartals Sesongindeksene


Regnearkimplementering av sesongjustering og eksponensiell utjevning. Det er greit å utføre sesongjustering og passe eksponensielle utjevningsmodeller ved hjelp av Excel. Skjermbilder og diagrammer nedenfor er hentet fra et regneark som er satt opp for å illustrere multiplikativ sesongjustering og lineær eksponensiell utjevning på Følgende kvartalsvise salgsdata fra Outboard Marine. For å få en kopi av regnearkfilen selv, klikk her. Versjonen av lineær eksponensiell utjevning som skal brukes her for demonstrasjonsformål, er Brown s-versjonen, bare fordi den kan implementeres med en enkelt kolonne av formler og det er bare en utjevningskonstant for optimalisering. Det er vanligvis bedre å bruke Holts versjon som har separate utjevningskonstanter for nivå og trend. Prognoseprosessen fortsetter som følger. Først blir dataene sesongjustert ii, og prognoser blir generert for sesongjusterte data via lineær eksponensiell utjevning og iii fin alliert sesongjusterte prognosene er resesasonalized for å få prognoser for den opprinnelige serien Sesongjusteringsprosessen utføres i kolonne D til G. Det første trinnet i sesongjustering er å beregne et sentrert glidende gjennomsnitt som utføres her i kolonne D Dette kan gjøres ved tar gjennomsnittet av to ettårige gjennomsnitt som kompenseres av en periode i forhold til hverandre. En kombinasjon av to offset-gjennomsnitt i stedet for et enkelt gjennomsnitt er nødvendig for sentrering når antall årstider er like. Det neste trinnet er å beregne forholdet til glidende gjennomsnitt - de opprinnelige dataene divideres med det bevegelige gjennomsnittet i hver periode - som utføres her i kolonne E Dette kalles også trend-syklus-komponenten i mønsteret, i den grad trend - og konjunktur-effekter kan regnes for å være alt som gjenstår etter gjennomsnitt over et helt års dataverdier. Selvfølgelig kan endringer i måned til måned som ikke skyldes sesongbestemte, bestemmes av mange andre faktorer s, men 12-måneders gjennomsnittet glatter over dem i stor grad Den estimerte sesongindeksen for hver sesong beregnes ved først å beregne alle forholdene for den aktuelle sesongen, som gjøres i celler G3-G6 ved hjelp av en AVERAGEIF-formel. Gjennomsnittskvoten blir deretter rescaled slik at de summerer til nøyaktig 100 ganger antall perioder i en sesong, eller 400 i dette tilfellet, som er gjort i celler H3-H6 Under kolonne F, benyttes VLOOKUP formler for å sette inn riktig sesongindeksverdi i hver rad av datatabellen, ifølge kvartalet representerer den det sentrert glidende gjennomsnittet og de sesongjusterte dataene ser ut som dette. Merk at det bevegelige gjennomsnittet vanligvis ser ut som en jevnere versjon av den sesongjusterte serien, og det er kortere i begge ender. Et annet regneark i samme Excel-fil viser anvendelsen av den lineære eksponensielle utjevningsmodellen til sesongjusterte data, som begynner i kolonne GA-verdi for utjevningskonstanten alfa er en tered over prognosen kolonnen her i celle H9 og for enkelhets skyld er det tildelt rekkevidde navn Alpha Navnet er tilordnet ved hjelp av kommandoen Sett inn navnnavn LES-modellen er initialisert ved å sette de to første prognosene lik den første virkelige verdien av sesongmessig justerte serier Formelen som brukes her for LES-prognosen, er rekursiv for en likning av Brown s-modellen. Denne formelen er angitt i cellen som svarer til den tredje perioden her, celle H15 og kopieres derfra Merk at LES-prognosen for Nåværende periode refererer til de to foregående observasjonene og de to foregående prognosefeilene, samt til verdien av alfa. Forutsigelsesformelen i rad 15 refererer således kun til data som var tilgjengelige i rad 14 og tidligere. Selvfølgelig, hvis vi ønsket å bruk enkle i stedet for lineær eksponensiell utjevning, vi kunne erstatte SES-formelen her i stedet. Vi kunne også bruke Holt s i stedet for Brown s LES-modellen, som ville kreve to flere kolonner av formu las for å beregne nivået og trenden som brukes i prognosen. Feilene beregnes i den neste kolonnen her, kolonne J ved å trekke prognosene fra de faktiske verdiene. Rotenes middelkvadratfeil beregnes som kvadratroten av variansen til feil pluss kvadratet av gjennomsnittet Dette følger av den matematiske identiteten MSE VARIANCE-feil AVERAGE-feil 2 Ved beregning av gjennomsnittet og variansen av feilene i denne formelen er de to første periodene utelukket fordi modellen ikke faktisk begynner prognoser før den tredje perioden rad 15 på regnearket Den optimale verdien av alfa kan bli funnet enten ved å endre alfa manuelt til minimum RMSE er funnet, ellers kan du bruke Solver til å utføre en nøyaktig minimering. Verdien av alfa som Solver funnet er vist her alpha 0 471. Det er vanligvis en god ide å plotte feilen til modellen i transformerte enheter og også å beregne og plotte sine autokorrelasjoner på lags på opptil en sesong. Her er en tidsserie plott av de sesongjusterte feilene. Feilautokorrelasjonene beregnes ved hjelp av CORREL-funksjonen for å beregne korrelasjonene av feilene med seg selv forsinket av en eller flere perioder - detaljer vises i regnearkmodellen. Her er et plot av autokorrelasjonene til feil i de fem første lagene. Autokorrelasjonene på lags 1 til 3 er svært nær null, men spissen ved lag 4, hvis verdi er 0 35, er litt plagsom - det antyder at sesongjusteringsprosessen ikke har vært helt vellykket. Det er faktisk bare marginalt signifikant 95 signifikansbånd for å teste om autokorrelasjoner er signifikant forskjellig fra null er omtrent pluss-eller-minus 2 SQRT nk, hvor n er prøvestørrelsen og k er laget. Her er n 38 og k varierer fra 1 til 5, så kvadratroten-av-n-minus-k er rundt 6 for dem alle, og derfor er grensene for å teste den statistiske signifikansen av avvik fra null, omtrent pluss-eller-minus 2 6 eller 0 33 Hvis du varierer verdien av alfa for hånd i denne Excel-modellen, kan du observere effekten på tidsseriene og autokorrelasjonsplottene av feilene, samt på roten-middel-kvadratfeilen som vil bli illustrert nedenfor. På undersiden av regnearket , blir prognoseformelen oppstartet inn i fremtiden ved bare å erstatte prognoser for faktiske verdier på det punktet hvor de faktiske dataene løper ut - det vil si hvor fremtiden begynner. Med andre ord, i hver celle der en fremtidig dataværdi vil oppstå, vil en cellehenvisning er satt inn som peker på prognosen laget for den perioden Alle de andre formlene kopieres rett og slett nedoverfra. Merk at feilene for fremtidsutsikter er alle beregnet til å være null Dette betyr ikke at de faktiske feilene vil være null, men heller det reflekterer bare det faktum at vi forutsetter at fremtidige data vil svare til prognosene i gjennomsnitt. De resulterende LES-prognosene for de sesongjusterte dataene ser slik ut. Med denne spesielle verdivurderingen e av alfa, som er optimal for prognoser i en periode, er den anslåtte trenden litt oppadgående, noe som reflekterer den lokale trenden som ble observert de siste 2 årene eller så. For andre verdier av alfa, kan det oppnås en helt annen trendfremvisning Det er vanligvis en god ide å se hva som skjer med den langsiktige trendprojeksjonen når alfa er variert, fordi verdien som er best for kortsiktig prognose, ikke nødvendigvis vil være den beste verdien for å forutse en lengre fremtid. For eksempel her er resultatet som oppnås hvis verdien av alfa er manuelt satt til 0 25. Den projiserte langsiktige trenden er nå negativ i stedet for positiv. Med en mindre verdi av alfa, legger modellen vekt på eldre data ved estimeringen av Nåværende nivå og trend og langsiktige prognoser reflekterer den nedadgående trenden de siste 5 årene fremfor den nyere oppadgående trenden. Dette diagrammet illustrerer også hvordan modellen med en lavere verdi av alfa er langsommere å svare på vendepunkter i dataene og derfor har en tendens til å gjøre en feil på det samme tegnet i mange perioder på rad. De 1-trinns prognosefeilene er større i gjennomsnitt enn de som er oppnådd før RMSE på 34 4 i stedet for 27 4 og sterkt positivt autokorrelert Lag-1 autokorrelasjonen på 0 56 overstiger i stor grad verdien av 0 33 beregnet ovenfor for en statistisk signifikant avvik fra null Som et alternativ til å svekke verdien av alfa for å introdusere mer konservatisme i langsiktige prognoser, trenddempingsfaktor blir noen ganger lagt til modellen for å få den projiserte trenden til å flate ut etter noen få tidsperioder. Det siste trinnet i å bygge prognosemodellen er å redealisere LES-prognosene ved å multiplisere dem med de riktige sesongindeksene. De resesasonaliserte prognosene i kolonne I er det enkelt produktet av sesongindeksene i kolonne F og sesongjusterte LES-prognosene i kolonne H. Det er relativt enkelt å beregne selvtillit intervaller for en-trinns prognoser laget av denne modellen, beregner du først RMSE root-mean-squared-feilen, som bare er kvadratroten til MSE, og beregner deretter et konfidensintervall for den sesongjusterte prognosen ved å legge til og subtrahere to ganger RMSE Generelt er et 95 konfidensintervall for en prognose for en periode fremover omtrent det samme som punktprognosen pluss-eller-minus-to ganger estimert standardavvik for prognosefeilene, forutsatt at feilfordelingen er omtrent normal og prøvestørrelsen er stor nok, si 20 eller mer Her er RMSE i stedet for standardprøvefeilen for feilene det beste estimatet av standardavviket for fremtidige prognosefeil fordi det tar forvirring, i tillegg til tilfeldige variasjoner. Tillitsgrensene for sesongmessig Justert prognose blir deretter resesasonalized sammen med prognosen, ved å multiplisere dem med de riktige sesongindeksene. I dette tilfellet er RMSE lik 27 4 og sesongjustert prognose for den første fremtidige perioden desember 93 er 273 2 så sesongjustert 95 konfidensintervall er fra 273 2-2 27 4 218 4 til 273 2 2 27 4 328 0 Multiplisere disse grensene innen desember s sesongindeks på 68 61 vi får lavere og øvre konfidensgrenser på 149 8 og 225 0 rundt prognosen for 93 poeng på 187 4. Forsigelsesgrenser for prognoser mer enn en periode framover vil generelt vokse som prognoseperioden øker, på grunn av usikkerhet om nivå og trend også som sesongfaktorer, men det er vanskelig å beregne dem generelt ved hjelp av analytiske metoder. Den riktige måten å beregne konfidensgrenser for LES-prognosen er ved å bruke ARIMA-teorien, men usikkerheten i sesongindeksene er en annen sak. Hvis du vil ha en realistisk selvtillit Intervall for en prognose mer enn en periode fremover, og tar alle feilkilder i betraktning, er det beste å bruke empiriske metoder for eksempel for å oppnå et konfidensintervall for en 2-trinns prognose, kan du opprette en annen kolonne på regnearket for å beregne en 2-trinns prognose for hver periode ved å oppstramme en-trinns prognose. Beregn deretter RMSE for 2-trinns prognosefeilene og bruk dette som grunnlag for et 2-trinns - forventet konfidensintervall. Slideshare bruker informasjonskapsler for å forbedre funksjonalitet og ytelse, og for å gi deg relevant reklame Hvis du fortsetter å surfe på nettstedet, godtar du bruken av informasjonskapsler på dette nettstedet. Se vår brukeravtale og personvernpolicy. Slideshare bruker informasjonskapsler til forbedre funksjonaliteten og ytelsen, og gi deg relevant reklame Hvis du fortsetter å surfe på nettstedet, godtar du bruken av informasjonskapsler på dette nettstedet Se vår personvernerklæring og brukeravtale for detaljer. Klar ut alle favorittemner i SlideShare-appen Få den SlideShare app for å lagre for senere, selv offline. Fortsett til det mobile nettstedet. Dobbeltklikk for å zoome ut. Del dette SlideShare. LinkedIn Corporation 2017.Multiplikativ justering Vurder grafen for US t ukjent salg av biler fra januar 1970 til mai 1998, i milliarder dollar, som rapportert på det tidspunkt av det amerikanske økonomidirektoratet. En stor del av utviklingen skyldes bare inflasjonen. Verdiene kan deflateres, dvs. konvertert til enheter av konstant snarere enn nominelle dollar ved å dele dem med en passende prisindeks som skaleres til en verdi på 1 0 i hvilket år som helst som basisår. Her er resultatet av oppdeling av det amerikanske forbrukerprisindekset KPI skalert til 1 0 i 1990, som konverterer enhetene til milliarder av 1990 dollar. Dataene kan bli funnet i denne Excel-filen, og den blir også analysert nærmere i sidene på sesongbaserte ARIMA-modeller på dette nettstedet. Det er fortsatt en generell oppadgående trend, og den økende amplituden av sesongvariasjoner tyder på et multiplikativt sesongmessig mønster sesongmessig effekt uttrykker seg i prosentvis, slik at den absolutte størrelsen på sesongvariasjonene øker etter hvert som serien vokser over tid. Et slikt mønster kan fjernes ved multiplikativ sesongjustering som oppnås ved å dividere hver verdi av tidsseriene med en sesongindeks en tall i nærheten av 1 0 som representerer prosentandelen av normalt vanligvis observert i den sesongen. For eksempel, hvis desember s salg er typisk 130 av den normale månedsverdien basert på historiske data, så vil hvert desember s salg sesongjustert ved å dividere med 1 3 Tilsvarende, hvis januar s salg er vanligvis bare 90 av normal, så vil hvert januar s salg bli sesongjustert ved å dividere med 0 9 Således ble verdiene i desember justert nedover, mens januar s ville bli justert oppover, korrigere for forventet sesongmessig effekt. Avhengig av hvordan de ble estimert fra dataene, kan sesongindeksene forbli det samme fra ett år til det neste, eller De kan variere sakte med tiden. De sesongbestemte indeksene som beregnes av sesongbestemte nedbrytningsprosedyren i Statgraphics, er konstante over tid, og beregnes via den såkalte forholdsmessige gjennomsnittlige metoden. For en forklaring på denne metoden, se lysbildene på prognoser med sesongjustering og notater på regnearksimplementering av sesongjustering Her er de multiplikative sesongindeksene for automatisk salg som beregnet av sesongbestemte nedbrytningsprosedyren i Statgraphics. Endelig er her sesongjustert versjon av deflatert automatisk salg som oppnås ved å dele hver måned s verdi ved sin estimerte sesongindeks. Notat at det utprøvde sesongmønsteret er borte, og det som gjenstår er trenden an d-sykliske komponenter i dataene, pluss tilfeldig støy. Adderejustering Som et alternativ til multiplikativ sesongjustering er det også mulig å utføre additiv sesongjustering En tidsserie hvis sesongvariasjoner er omtrent konstant i størrelse uavhengig av nåværende gjennomsnittsnivå av serie, vil være en kandidat for additiv sesongjustering I additiv sesongjustering justeres hver verdi av en tidsserie ved å legge til eller subtrahere en mengde som representerer det absolutte beløpet som verdien i årets sesong pleier å være under eller over Normal, som estimert fra tidligere data. Addere sæsonmessige mønstre er noe sjeldne i naturen, men en serie som har et naturlig multiplikativ sesongmønster konverteres til ett med et additiv sesongmønster ved å bruke en logaritme transformasjon til de opprinnelige dataene. Derfor, hvis du er bruk av sesongjustering i forbindelse med en logaritme transformasjon, bør du sannsynligvis bruke additiv heller t han multiplikativ sesongjustering I sesongbasert nedbrytning og prognoseprosedyrer i Statgraphics får du valget mellom additiv og multiplikativ sesongjustering. Tilbake til toppen av siden. Akronymer Ved undersøkelse av beskrivelser av tidsserier i Datadisk og andre kilder står akronym SA for sesongjustert, mens NSA står for ikke sesongjustert En sesongjustert årskurs SAAR er en tidsserie hvor hver periodes verdi er justert for sesongmessig og deretter multiplisert med antall perioder om året, som om samme verdi hadde vært oppnådd i hver periode i et helt år. Tilbake til toppen av siden.

No comments:

Post a Comment