David, ja, MapReduce er ment å operere på en stor mengde data. Og ideen er at kart og reduksjonsfunksjoner generelt burde ikke vare hvor mange mappere eller hvor mange reduksjonsmaskiner det er, det er bare optimalisering. Hvis du tenker nøye på algoritmen jeg postet, kan du se at det ikke spiller noen rolle hvilken mapper får hvilke deler av dataene hver inngangspost vil være tilgjengelig for alle redusere operasjoner som trenger det Joe K Sep 18 12 på 22 30.I best av min forståelse flytter gjennomsnittet er ikke pent kart til MapReduce-paradigmet siden beregningen er i hovedsak skyvevindu over sorterte data, mens MR behandler ikke-kryssede områder av sorterte data Løsning jeg ser er som følger a For å implementere tilpasset partisjoner for å kunne lage to forskjellige partisjoner i to løp I hvert løp vil reduksjonene dine få forskjellige dataområder og beregne glidende gjennomsnitt hvor passende jeg vil prøve å illustrere. I første løpsdata for reduksjonsaggregat skal R1, Q7, Q8. Der vil du cacluate glidende gjennomsnitt for noen Qs. In neste runde bør reduksjonsapparatene få data som R1 Q1 Q6 R2 Q6 Q10 R3 Q10 Q14. Og caclulate resten av bevegelige gjennomsnitt. Da må du samle resultater. tilpasset partisjoner at den vil ha to operasjonsmoduser - hver gang de deler inn i like rekkevidde, men med litt skift I en pseudokode vil det se ut som denne partisjonsknappen SHIFT MAXKEY numOfPartisjoner hvor SHIFT vil bli tatt fra konfigurasjonen MAXKEY maksimal verdi av nøkkelen jeg antar for enkelhet at de starter med null. RecordReader, IMHO er ikke en løsning siden det er begrenset til spesifikk splitt og kan ikke glide over splittens grense. En annen løsning ville være å implementere tilpasset logikk for å dele inndataene det er en del av InputFormat It kan gjøres for å gjøre 2 forskjellige lysbilder, ligner partisjonering. ansvaret 17. september kl. 12 på 8 59. Når du beregner et løpende bevegelige gjennomsnitt, er det viktig å plassere gjennomsnittet i mellomtiden. I det forrige eksempelet komprimerer vi utgjorde gjennomsnittet av de første 3 tidsperioder og plassert det ved siden av periode 3 Vi kunne ha plassert gjennomsnittet midt i tidsintervallet på tre perioder, det vil si ved siden av periode 2 Dette fungerer bra med ulike tidspunkter, men ikke så bra for like tidsperioder Så hvor ville vi plassere det første glidende gjennomsnittet når M 4. Teknisk sett ville det bevegelige gjennomsnittet falle på t 2 5, 3 5. For å unngå dette problemet glattes vi MAs ved å bruke M 2 Således glir vi jevnte verdier. Hvis vi gjennomsnittlig et jevnt antall vilkår, må vi glatte de jevne verdiene. Følgende tabell viser resultatene ved hjelp av M 4.Predictive Analytics med Microsoft Excel Arbeide med Seasonal Time Series. I dette Chapter. Simple Seasonal Averages. Gjennomsnitt og sentrert Moving Averages. Linear Regression with Coded Vectors. Simple Seasonal Eksponentiell Smoothing. Holt-Winters Models. Matters blir gradvis mer komplisert når du har en tidsserie som er preget av delvis sesongmessig tendens tendensen til å stige og faller i henhold til årstiden. Vi bruker begrepet sesong i en mer generell forstand enn den daglige betydningen av årets fire årstider. I sammenheng med prediktiv analyse kan en sesong være en dag hvis mønstre gjentas ukentlig eller et år i form av presidentsvalgssykluser eller omtrent alt i mellom. Et åtte-timers skift på et sykehus kan utgjøre en sesong. Dette kapittelet tar en titt på hvordan å dekomponere en tidsserie slik at du kan se hvordan sesongens funksjon fungerer bortsett fra dens trend hvis noe Som du kanskje forventer av materialet i kapittel 3 og 4, er det flere tilnærminger tilgjengelig for deg. Enkel sesongmessige gjennomsnitt. Bruken av enkle sesongmessige gjennomsnitt for å modellere en tidsserie kan noen ganger gi deg en ganske rå modell for dataene Men tilnærmingen vektlegger årstidene i datasettet, og det kan lett være mye mer nøyaktig som en prognosemetode enn enkel eksponensiell utjevning når sesongmessigheten er uttalt. Det virker som en nyttig Introduksjon til noen av prosedyrene som brukes med tidsserier som er både sesongmessige og trendede, så ta en titt på eksemplet i Figur 5 1.Figur 5 1 Med en horisontal modell, gir enkle gjennomsnitt prognoser som ikke er mer enn sesongmessige midler. Dataene og diagrammet som vises i Figur 5 1 representerer gjennomsnittlig antall daglige treff på et nettsted som henvender seg til fans av National Football League. Hver observasjon i kolonne D representerer gjennomsnittlig antall treff per dag i hver av fire kvartaler på en fem - årsperspektiv. Identifisere et sesongbasert mønster. Du kan fortelle fra gjennomsnittene i området G2 G5 at en tydelig kvartalseffekt finner sted. Det største gjennomsnittlige antall treff skjer i løpet av høst og vinter, når de viktigste 16 spillene og sluttspillene er planlagt Renter, målt ved gjennomsnittlige daglige treff, avtar i løpet av våren og sommermånedene. Gjennomsnittene er enkle å beregne om du ikke føler deg komfortabel med matriseformler For å få gjennomsnittet av alle fem forekomster av Q uarter 1, for eksempel kan du bruke denne arrayformelen i celle G2 på figur 5 1.Array - skriv inn den med Ctrl Shift Enter Eller du kan bruke AVERAGEIF-funksjonen. som du kan skrive inn på vanlig måte, trykk Enter-tasten In Generelt foretrekker jeg array-tilnærmingen fordi det gir meg mulighet for større kontroll over de involverte funksjonene og kriteriene. Den kartlagte dataregruppen inneholder datatiketter som viser hvilket kvartal hvert datapunkt tilhører Kartet ekko meldingen til gjennomsnittene i G2 G5 Quarters 1 og 4 gjentatte ganger får flest treff. Det er klart sesongmessig i dette datasettet. Beregning av sesongbaserte indekser. Etter at du har bestemt at en tidsserie har en sesongkomponent, vil du kvantifisere størrelsen på effekten. Gjennomsnittene vist i Figur 5 2 representerer hvordan metoden for gjennomsnittlig gjennomsnitt går til den oppgaven. Figur 5 2 Kombiner det store gjennomsnittet med sesongmessige gjennomsnitt for å få sesongindeksene. I figur 5 2 får du additiv sesongindekser i området G10 G13 ved å trekke fra stor gjennomsnitt i celle G7 fra hvert sesongens gjennomsnitt i G2 G5 Resultatet er effekten av å være i kvartal 1, det å være i kvartal 2 osv. Hvis en gitt måned er i kvartal 1, forventer du at den skal ha 99 65 mer gjennomsnittlig daglig treff enn det store gjennomsnittet på 140 35 treff per dag. Denne informasjonen gir deg en følelse av hvor viktig det er å være i en bestemt sesong. Antag at du eier det aktuelle nettstedet og du vil selge reklameplass på det Du kan sikkert spørre en høyere pris på annonsører i løpet av første og fjerde kvartal enn i løpet av andre og tredje. I tillegg til det kan du sannsynligvis belaste dobbelt så mye i løpet av første kvartal enn i løpet av det andre eller det tredje. Med sesongindeksene i hånden kan du også beregne sesongjusteringer. For eksempel vises fortsatt sesongjusterte verdier for hvert kvartal i 2005 i G16 G19. De beregnes ved å trekke indeksen fra den tilhørende kvartalsmåling. Tradisjonelt er begrepet sesongbasert indeks refererer til økningen eller reduksjonen i nivået av en serie som er knyttet til hver sesong. Den synonyme sesongmessige effekten har dukket opp i litteraturen de siste årene. Fordi du ser begge vilkårene, har jeg brukt dem begge i denne boken. liten ting bare vær oppmerksom på at de to begrepene har samme betydning. Merk at i det vanlige løpet av hendelsene fra 2001 til 2005, forventer du at resultatet i andre kvartalet skal ligge bak resultatet i første kvartal med 133 6, det vil si 99 65 minus 33 95 Men i både 2004 og 2005 overstiger de sesongjusterte resultatene for andre kvartal det første kvartalet. Resultatet vil kanskje be deg om å spørre hva som har endret seg de siste to årene som reverserer forholdet mellom sesongjusterte resultater for de to første kvartalene har jeg ikke forfulgt det spørsmålet her, jeg tar det opp for å tyde på at du ofte vil ta en titt på både de observerte og sesongjusterte tallene. Forutsetninger fra Simple Seasonal Avera Ingen trend. Selv om metoden for enkle gjennomsnitt er som jeg sa tidligere rå, kan det være mye mer nøyaktig enn det mer sofistikerte alternativet for eksponensiell utjevning, spesielt når sesongens effekter er uttalt og pålitelig. Når tidsseriene er uttrengte, som er tilfellet med eksemplet denne delen har diskutert, er de enkle sesongprognosene ikke noe mer enn sesongens gjennomsnitt. Når serien ikke trender enten opp eller ned, er ditt beste estimat av verdien for neste sesong den sesongens historiske gjennomsnitt Se Figur 5 3.Figurer 5 3 Kombiner det store gjennomsnittet med sesongmessige gjennomsnitt for å få sesongindeksene. I diagrammet i Figur 5 3 representerer den stiplede linjen prognosene fra enkel utjevning. De to faste linjene representerer de faktiske sesongmessige observasjonene og sesongmidlene Legg merke til at sesongmessige gjennomsnitt sporer de faktiske sesongbaserte observasjonene ganske tett mye tettere enn de jevne prognosene. Du kan se hvor mye nærmere fra de to RMSEene i cellene F23 og H23 RMSE for sesongmessige gjennomsnitt er bare litt mer enn en tredjedel av RMSE for de jevne prognosene. Du kan kritisere det opp til størrelsen på sesongens effekter, samt deres konsistens. Opptatt for eksempel at forskjellen mellom gjennomsnittlig første og andre kvartal var 35 0 i stedet for 133 6 som er forskjellen mellom cellene G2 og G3 i figur 5 2 I en utjevningskontekst ville den faktiske verdien for kvartal 1 være en mye bedre prediktor for verdien for kvartal 2 enn det som er tilfelle med denne tidsserien Og eksponensiell utjevning kan stole tungt på verdien av den nåværende observasjonen for sin prognose for neste periode Hvis utjevningskonstanten er satt til 1 0, løser eksponensiell utjevning til å prognose og prognosen er alltid den samme som tidligere. Faktumet at størrelsen på hver sesongmessig sving er så konsekvent fra kvartal til kvartal, betyr at de enkle sesongmidlene er pålitelige prognoser. Ingen faktisk quarte rly observasjon avgår veldig langt fra det samlede sesongmessige gjennomsnittet. Simple sesongmessige gjennomsnitt med Trend. Bruk av enkle sesongmessige gjennomsnitt med en trended serie har noen reelle ulemper, og jeg er fristet til å foreslå at vi ignorerer det og fortsette til meatier emner. Men det Det er mulig at du kommer til å løbe inn i situasjoner der noen har brukt denne metoden, og da vant det ikke vondt å vite både hvordan det virker og hvorfor det er bedre valg. En ny metode for å håndtere sesongmessighet i en trendserie må håndtere det grunnleggende problemet av disentangling effekten av trenden fra sesongens sesongmessighet Sesongstendigheten har en tendens til å skjule trenden, og omvendt Se figur 5 4.Figur 5 4 Tilstedeværelsen av trenden kompliserer beregningen av sesongmessige effekter. Faktumet at trenden i serien er oppadgående over tid betyr det at det bare gjøres en gjennomsnittlig observasjon av sesongens observasjoner, slik det var gjort i nei-trend-saken, konfronterer den generelle trenden med sesongvarianter. Den vanlige ideen er å redegjøre for trenden separat ely fra de sesongmessige effektene Du kan kvantifisere trenden og trekke dens effekt fra de observerte dataene Resultatet er en utrinnet serie som beholder sesongvariasjonen. Det kan håndteres på samme måte som jeg illustrert tidligere i dette kapittelet. Beregning av middel for hver Year. One måte å forstyrre dataene og andre måter vil uten tvil oppstå, er å beregne trenden basert på årlige gjennomsnitt i stedet for kvartalsdata. Ideen er at det årlige gjennomsnittet er ufølsomt for sesongens effekter. Det er hvis du trekker et år s er basert på verdien for hvert av sine kvartaler, er summen og dermed gjennomsnittet av de fire kvartalseffektene nettopp null. En trend beregnet med årlige gjennomsnitt er ikke påvirket av sesongvariasjonene. Denne beregningen vises i figur 5 5.Figur 5 5 Denne metoden legger nå lineær regresjon på de enkle gjennomsnittene. Det første trinnet i detrending av dataene er å få gjennomsnittlige daglige treff for hvert år. Det er gjort i området H3 H7 i Figu re 5 5 Formelen i celle H3, for eksempel, er AVERAGE D3 D6.Calculating Trend Basert på Annual Means. With det årlige gjennomsnittet i hånden, er du i stand til å beregne deres trend som er administrert ved å bruke LINEST i serien I3 J7, ved hjelp av denne arrayformelen. Hvis du ikke gir x-verdier som det andre argumentet til LINEST Excel, leverer standard x-verdier for deg. Standardene er bare de sammenhengende heltallene som begynner med 1 og slutter med antall y-verdier som du ringer etter i det første argumentet I dette eksemplet er standard x-verdiene identiske med de som er angitt på regnearket i G3 G7, slik at du kan bruke LINEST H3 H7 TRUE Denne formelen bruker to standardverdier for x-verdiene og konstanten , representert av de tre påfølgende kommasene. Poenget med denne øvelsen er å kvantifisere år-til-år-trenden, og LINEST gjør det for deg i celle I3 Den cellen inneholder regresjonskoeffisienten for x-verdiene Multiply 106 08 by 1 da med 2 deretter med 3, 4 og 5 og legg til hvert resultat i ntercept av 84 63 Selv om det får årlige prognoser, er det viktige punktet for denne prosedyren verdien av koeffisienten 106 08, som kvantifiserer den årlige trenden. Trinnet jeg nettopp diskuterte, er kilden til mine bekymringer om hele tilnærmingen som denne delen beskriver at du vanligvis har et lite antall omkledningsperioder i dette eksemplet, at s år å løpe gjennom regresjonen. Regresjonens resultater har en tendens til å være veldig ustabil når de som her er basert på et lite antall observasjoner. Likevel er denne prosedyren avhengig av disse resulterer tungt for å forstyrre tidsseriene. Forskjellige trender over årstider. Enkelthåndteringsmetoden for å håndtere en trendet sesongbasert serie som denne fortsetter ved å dividere trenden med antall perioder i den overordnede perioden for å få en per-trend trend Her er antall perioder per år fire vi jobber med kvartalsdata slik at vi deler 106 08 ved 4 for å estimere trenden per kvartal på 26 5. Prosedyren bruker s den periodiske trenden ved å trekke den fra det gjennomsnittlige periodiske resultatet Formålet er å fjerne effekten av den årlige trenden fra sesongmessige effekter. Først må vi imidlertid beregne gjennomsnittsresultatet over alle fem år for periode 1, for periode 2 og osv. For å gjøre det, bidrar det til å omarrangere listen over faktiske kvartalsresultater, vist i området D3 D22 i figur 5 5, til en matrise på fem år med fire kvartaler, vist i området G11 J15 Merk at verdiene i den matrisen samsvarer med listen i kolonne D. Med dataene som er arrangert på den måten, er det enkelt å beregne gjennomsnittlig kvartalsverdi over de fem årene i datasettet som er gjort i området G18 J18. Effekten av trenden returnert av LINEST vises i rekkevidde G19 J19 Utgangsverdien for hvert år er de observerte gjennomsnittlige daglige treffene for første kvartal, slik at vi ikke foretar justeringer for første kvartal. En kvarts trender, eller 26 5, trekkes fra andre kvartal s mener treff, noe som resulterer i en a djustert andre kvartal verdi av 329 9 se celle H21, Figur 5 5 To fjerdedeler verdier, 2 26 5 eller 53 i celle I19, trekkes fra tredje kvartal s gjennomsnitt for å få en justert tredje kvartal verdi på 282 6 i celle I21 Og tilsvarende for fjerde kvartal trekker tre fjerdedeler av trend fra 454 4 for å få 374 8 i celle J21. Husk at hvis trenden var nede heller enn opp, som i dette eksempelet, ville du legge til den periodiske trendverdien til den observerte periodiske måten i stedet for å trekke den inn. Konvertering av de justerte sesongmessige midler til sesongmessige effekter. Ved logikken av denne metoden er verdiene vist i rad 20 21 i figur 5 5 de gjennomsnittlige kvartalsresultater for hver av fire fjerdedeler, med effekten av den generelle oppadgående trenden i datasettet fjernet Rader 20 og 21 slås sammen i kolonnene G til J Med sin trend ut av veien, kan vi konvertere disse tallene til estimater av sesongmessige effekter som følge av å være i første kvartal, i andre kvartal, og så videre For å få dem effekter, begynner med å beregne det store gjennomsnittet av den korrigerte kvartalsmidlet. Den justerte store gjennomsnittet vises i celle I23. Analysen fortsetter i Figur 5 6.Figur 5 6 Kvartalseffekter, eller indekser, brukes til å desalasonalisere de observerte kvartallene. Figur 5 6 gjentar kvartalsjusteringene og den justerte grenseverdien fra bunnen av figur 5 5 De er kombinert for å bestemme kvartalsindeksene som du også kan tenke på som sesongmessige effekter. For eksempel er formelen i celle D8 som følger. Den returnerer 33 2 Det er effekten av å være i andre kvartal, med tanke på det store gjennomsnittet Med hensyn til det store gjennomsnittet, kan vi forvente et resultat som tilhører andre kvartal å falle under det store gjennomsnittet med 33 2 enheter. Å bruke Seasonal Effekter på Observed Quarterlies. For å gjenoppta Så langt har vi kvantifisert den årlige trenden i dataene via regresjon og delt den trenden med 4 for å prorate den til en kvartalsverdi. Plukke opp i Figur 5 6 justerte vi gjennomsnittet for hvert kvartal i C3 F3 ved å subtrahere de forløpte trender i C4 F4 Resultatet er et avgrenset estimat av gjennomsnittet for hvert kvartal, uansett år hvor kvartalet foregår, i C5 F5. Vi subtraherte det justerte grunne gjennomsnittet i celle G5 fra Korrigert kvartalsmiddel i C5 F5 Som konverterer hvert kvartal er gjennomsnittet til et mål på effekten av hvert kvartal i forhold til den justerte grunneverdien. Det er sesongens indekser eller effekter i C8 F8.Neste fjerner vi sesongmessige effekter fra de observerte kvartalsnivåene Som vist i figur 5 6 gjør du det ved å trekke kvartalsindeksene i C8 F8 fra de tilsvarende verdiene i C12 F16. Den enkleste måten å gjøre det på er å skrive inn denne formelen i celle C20. Merk det enkle dollarteegnet før de 8 i referansen til C 8 Det er en blandet referanse delvis relativ og delvis absolutt Dollarsignalet forankrer referansen til åttende rad, men kolonndelen av referansen kan variere. Derfor, etter at sistnevnte formel er angitt i celle C20, kan du klikk på celle s utvalg håndtere det lille torget i det nedre høyre hjørnet av en valgt celle og dra til høyre i celle F20 Adressene justeres når du drar til høyre og du slutter med verdiene, med årstidens effekter fjernet, for år 2001 i C20 F20 Velg det området på fire celler og bruk multiple seleksjonshåndtaket, nå i F20, for å dra ned i rad 24 Så fyller du resten av matrisen. Det er viktig å huske på at vi justerer originalen Kvartalsverdier for sesongmessige effekter Uansett trenden som eksisterte i de opprinnelige verdiene er fortsatt der, og i teorien forblir i det minste etter at vi har gjort justeringer for sesongmessige effekter. Vi har fjernet en trend, ja, men bare fra sesongens effekter. når vi trekker de avgrensede sesongvirkningen fra de opprinnelige kvartalsvise observasjonene, er resultatet de opprinnelige observasjonene med trenden, men uten sesongmessige effekter. Jeg har kartlagt de sesongjusterte verdiene i Figur 5 6 Sammenlign t Hattdiagram til diagrammet i Figur 5 4 Merk på Figur 5 6 at selv om desesasonaliserte verdier ikke ligger nøyaktig på en rett linje, har mye av sesongvirkningen blitt fjernet. Regressering av Deseasonalized Quarterlies på tidsperioden. Det neste trinnet er å skape prognoser fra sesongjusterte trender i Figur 5 6 celler C20 F24, og på dette punktet har du flere alternativer tilgjengelig Du kan bruke differensieringsmetoden kombinert med enkel eksponensiell utjevning som ble diskutert i kapittel 3, Arbeide med Trended Time Series Du kan også bruke Holt s tilnærming til utjevning av trendserier, diskutert i både kapittel 3 og kapittel 4, Initialisering av prognoser. Begge metodene gir deg muligheten til å skape en en-trinns prognose, som du vil legge til den tilsvarende sesongindeksen. En annen tilnærming, som jeg skal bruke her, setter først trenderne gjennom en annen forekomst av lineær regresjon og legger deretter til sesongens indeks. Se figur 5. 7.Figur 5 7 Fi Første sannsynlige prognose er i rad 25. Figur 5 7 returnerer desesasonalized kvartalsmidler fra tabellarrangementet i C20 F24 på figur 5 6 til listearrangementet i området C5 C24 i figur 5 7. Vi kunne bruke LINEST sammen med dataene i B5 C24 på figur 5 7 for å beregne regresjonsligningen s intercept og koeffisient så kunne vi multiplisere koeffisienten med hver verdi i kolonne B og legge til avskjæringen for hvert produkt for å lage prognosene i kolonne D Men selv om LINEST returnerer nyttig annen informasjon enn koeffisienten og avskjæringen, er TREND en raskere måte å få prognosene på, og jeg bruker den på figur 5. 7.Det utvalg D5 D24 inneholder prognosene som følge av å regresse desesasonalized kvartalsstallene i C5 C24 på perioden i B5 B24 Strukturformelen som brukes i D5 D24 er dette. Dette settet av resultater gjenspeiler effekten av den generelle oppadgående trenden i tidsseriene. Fordi de verdiene TREND prognostiserer fra er blitt desaasonalisert, forblir det å legge til de sesongmessige effektene, også kjent som sesongindekser, tilbake til den trente prognosen. Legg til sesongindeksene tilbake i. Sesongindeksene, beregnet i figur 5 6, er vist i figur 5 7 først i området C2 F2 og deretter gjentatte ganger i rekkevidde E5 E8, E9 E12 osv. De resesasonaliserte prognosene er plassert i F5 F24 ved å legge til sesongmessige effekter i kolonne E til trendprognosene i kolonne D. Til å få en-trinns prognose i celle F25 i figur 5 7 Verdien av t for neste periode går inn i celle B25 Følgende formel er oppgitt i celle D25.It instruerer Excel å beregne regresjonsligningen som prognoser verdier i området C5 C24 fra de i B5 B24, og bruk den ligningen til Den nye x-verdien i celle B25. Den aktuelle sesongindeksen er plassert i celle E25, og summen av D25 og E25 er plassert i F25 som den første ekte prognosen for trender og sesongmessige tidsserier. Du finner hele settet av desesasonalized quarterlies og prognosene kartlagt i Figur 5 8.Figur 5 8 De sesongmessige effektene returneres til prognosene. Evaluering Enkle gjennomsnitt. Tilnærmingen til å håndtere en sesongmessig tidsserie, diskutert i flere tidligere seksjoner, har noe intuitivt appell. Den grunnleggende ideen virker rettferdig. Beregne en årlig trend ved å regresse årlige midler mot et tidsrom. Divide den årlige trenden mellom perioder i løpet av året. Trekk den fordelte trenden fra de periodiske effektene for å få justerte effekter. Trekk de justerte effektene fra de faktiske tiltakene for å deseasonalisere tidsserien. Lag opp prognoser fra deseasonalized serien, og legg til de justerte sesongmessige effektene tilbake i. Min egen oppfatning er at flere problemer svekker tilnærmingen, og jeg ville ikke ha tatt med den i denne boken, bortsett fra at du sannsynligvis vil støte på den og derfor burde være kjent med det Og det gir et nyttig springbrett for å diskutere noe konsept og prosedyrer som finnes i andre, sterkere tilnærminger. Først er det spørsmålet om hvilken Jeg klaget tidligere i dette kapitlet om den svært små prøvestørrelsen for regresjon av årlige midler på sammenhengende heltall som identifiserer hvert år. Selv med bare en prediktor, så få som 10 observasjoner skraper virkelig bunnen av fatet. I det minste bør du se på den resulterende R 2 justert for krymping og sannsynligvis beregne standardfeilen på estimatet tilsvarende. Det er sant at jo sterkere korrelasjonen i befolkningen, desto mindre er prøven du kan komme unna med. Men jobber med kvartaler i løpet av år, blir du heldig for å finne så mange som 10 år verdt av kvartalsvise observasjoner hver gang, målt på samme måte over det tidsforløpet. Jeg overtalte ikke at svaret på det problematiske opp-og ned-mønsteret du finner innen et år, se diagrammet i Figur 5 4 er å gjennomsnittlig ut toppene og dalene og få et trendestimat fra årlige midler. Sikkert er det ett svar på det problemet, men som du vil se, er det så mye sterkere met od av segregating de sesongmessige effekter fra en underliggende trend, regnskap for dem begge, og prognoser tilsvarende vil jeg dekke denne metoden senere i dette kapittelet, i avsnittet Linear Regression with Coded Vectors. Videre er det ingen grunnlag i teorien for å distribuere den årlige trend jevnt mellom perioder som komponerer året Det er sant at lineær regresjon gjør noe lignende når det plasserer prognosene på en rett linje. Men det er en stor kløft mellom å gjøre en grunnleggende forutsetning fordi den analytiske modellen ikke ellers kan håndtere dataene og akseptere et feilaktig resultat hvis feilfeil i prognosene kan måles og evalueres. Når det er sagt, la oss gå videre til bruk av bevegelige gjennomsnitt i stedet for enkle gjennomsnitt som en måte å håndtere sesongmessighet på.
No comments:
Post a Comment