Monday, 17 April 2017

Moving Average Of Time Series

Die Funktion Moving Average (Zeitreihe) gibt den gleitenden Durchschnitt eines Feldes über einen bestimmten Zeitraum basierend auf einer linearen Regression zurück. Parameter ------------------ Data Die Daten, die in der Regression verwendet werden sollen. Dies ist typischerweise ein Feld in einer Datenreihe oder ein berechneter Wert. Period Die Anzahl der Takte, die in die Regression eingeschlossen werden sollen, einschließlich des aktuellen Wertes. Zum Beispiel enthält eine Periode von 3 den aktuellen Wert und die beiden vorherigen Werte. Funktion Wert ------------------------ Der Zeitreihenbewegungsdurchschnitt wird durch Anpassen einer linearen Regressionsgerade über die Werte für den gegebenen Zeitraum berechnet und dann bestimmt Den aktuellen Wert für diese Zeile. Eine lineare Regressionsgerade ist eine Gerade, die so nahe wie möglich an allen gegebenen Werten liegt. Der Zeitreihen-Gleitender Durchschnitt am Anfang einer Datenreihe ist nicht definiert, bis es genug Werte gibt, um den vorgegebenen Zeitraum zu füllen. Es ist anzumerken, dass sich ein Zeitreihenbewegungsdurchschnitt stark von anderen Arten von Bewegungsdurchschnitten unterscheidet, da der aktuelle Wert dem jüngsten Trend der Daten folgt, nicht einem tatsächlichen Durchschnitt der Daten. Aus diesem Grund kann der Wert dieser Funktion größer oder kleiner sein als alle Werte, die verwendet werden, wenn der Trend der Daten im Allgemeinen zunimmt oder abnimmt. Verwendung ---------- Verschieben von Durchschnitten sind nützlich zum Glätten von verrauschten Rohdaten wie Tagespreisen. Die Preisdaten können von Tag zu Tag stark variieren, wodurch der Preis nach oben oder nach unten verschwindet. Mit Blick auf den gleitenden Durchschnitt des Preises, ein allgemeineres Bild der zugrunde liegenden Trends gesehen werden kann. Da bewegte Durchschnitte verwendet werden können, um Trends zu sehen, können sie auch verwendet werden, um zu sehen, ob Daten den Trend stecken. Ein / Aus-Systeme vergleichen oft Daten mit einem gleitenden Durchschnitt, um zu bestimmen, ob sie einen Trend unterstützen oder einen neuen starten. Ein Beispiel für die Verwendung eines Moving Average in einem Ein - / Ausgabesystem finden Sie in den Beispiel-Ein - / Ausgabesystemen. Diese Funktion entspricht der Linear Regression Indicator. Es ist auch das gleiche wie die Zeitreihenprognose mit einem Offset von Null. Moving Durchschnitte Moving Averages Bei herkömmlichen Datensätzen ist der Mittelwert oft die erste und eine der nützlichsten, zusammenfassenden Statistiken zu berechnen. Wenn die Daten in Form einer Zeitreihe vorliegen, ist das Serienmittel ein nützliches Maß, spiegelt aber nicht die dynamische Natur der Daten wider. Meanwerte, die über kurzgeschlossene Perioden berechnet werden, die entweder der aktuellen Periode vorangehen oder auf die aktuelle Periode zentriert sind, sind oft nützlicher. Weil solche Mittelwerte sich ändern oder sich bewegen, wenn sich die aktuelle Periode von der Zeit t & sub2 ;, t & sub3; usw. bewegt, werden sie als gleitende Durchschnittswerte (Mas) bezeichnet. Ein einfacher gleitender Durchschnitt ist (üblicherweise) der ungewichtete Durchschnitt von k vorherigen Werten. Ein exponentiell gewichteter gleitender Durchschnitt ist im Wesentlichen derselbe wie ein einfacher gleitender Durchschnitt, aber mit Beiträgen zum Mittelwert, der durch ihre Nähe zur aktuellen Zeit gewichtet wird. Da es keine einzige, sondern eine ganze Reihe von gleitenden Mittelwerten für eine beliebige Reihe gibt, kann der Satz von Mas selbst auf Graphen aufgetragen, als Serie analysiert und in der Modellierung und Prognose verwendet werden. Eine Reihe von Modellen kann mit gleitenden Durchschnitten konstruiert werden, und diese werden als MA-Modelle bekannt. Wenn solche Modelle mit autoregressiven (AR) Modellen kombiniert werden, sind die resultierenden zusammengesetzten Modelle als ARMA - oder ARIMA-Modelle bekannt (die I ist für integriert). Einfache gleitende Mittelwerte Da eine Zeitreihe als ein Satz von Werten betrachtet werden kann, können t 1,2,3,4, n der Mittelwert dieser Werte berechnet werden. Wenn wir annehmen, daß n ziemlich groß ist, so wählen wir eine ganze Zahl k, die viel kleiner als n ist. Können wir einen Satz von Blockdurchschnitten oder einfache Bewegungsdurchschnitte (der Ordnung k) berechnen: Jede Messung repräsentiert den Mittelwert der Datenwerte über ein Intervall von k Beobachtungen. Man beachte, daß das erste mögliche MA der Ordnung kgt0 dasjenige für tk ist. Allgemeiner können wir den zusätzlichen Index in die obigen Ausdrücke schreiben und schreiben: Dies bedeutet, daß der geschätzte Mittelwert zum Zeitpunkt t der einfache Mittelwert des beobachteten Wertes zum Zeitpunkt t und den vorhergehenden k -1 Zeitschritten ist. Wenn Gewichte angewandt werden, die den Beitrag von Beobachtungen verringern, die weiter weg in der Zeit sind, wird der gleitende Durchschnitt als exponentiell geglättet. Gleitende Mittelwerte werden häufig als eine Form der Prognose verwendet, wobei der Schätzwert für eine Reihe zum Zeitpunkt t 1, S t1. Wird als MA für den Zeitraum bis einschließlich der Zeit t genommen. z. B. Die heutige Schätzung basiert auf einem Durchschnitt der bisherigen aufgezeichneten Werte bis einschließlich gestern (für tägliche Daten). Einfache gleitende Mittelwerte können als eine Form der Glättung gesehen werden. In dem nachfolgend dargestellten Beispiel wurde der in der Einleitung zu diesem Thema gezeigte Luftverschmutzungs-Datensatz um eine 7-tägige gleitende Linie (MA) ergänzt, die hier in Rot dargestellt ist. Wie man sehen kann, glättet die MA-Linie die Spitzen und Täler in den Daten und kann sehr hilfreich sein, um Trends zu identifizieren. Die Standard-Vorwärtsberechnungsformel bedeutet, dass die ersten k-1-Datenpunkte keinen MA-Wert haben, aber danach rechnen sich die Berechnungen auf den Enddatenpunkt in der Reihe. PM10 tägliche Mittelwerte, Greenwich Quelle: London Air Quality Network, londonair. org. uk Ein Grund für die Berechnung einfacher gleitender Mittelwerte in der beschriebenen Weise ist, dass es Werte für alle Zeitschlitze von der Zeit tk bis zur Gegenwart berechnet werden kann, und Wenn eine neue Messung für die Zeit t 1 erhalten wird, kann die MA für die Zeit t 1 zu dem bereits berechneten Satz addiert werden. Dies bietet eine einfache Vorgehensweise für dynamische Datensätze. Allerdings gibt es einige Probleme mit diesem Ansatz. Es ist vernünftig zu argumentieren, dass sich der Mittelwert der letzten 3 Perioden zum Zeitpunkt t -1, nicht zur Zeit t, befinden sollte. Und für eine MA über eine gerade Anzahl von Perioden vielleicht sollte sie sich in der Mitte zwischen zwei Zeitintervallen befinden. Eine Lösung für dieses Problem besteht darin, zentrierte MA-Berechnungen zu verwenden, bei denen der MA zum Zeitpunkt t der Mittelwert einer symmetrischen Menge von Werten um t ist. Trotz seiner offensichtlichen Verdienste wird dieser Ansatz nicht allgemein verwendet, weil er erfordert, dass Daten für zukünftige Ereignisse verfügbar sind, was möglicherweise nicht der Fall sein kann. In Fällen, in denen die Analyse vollständig aus einer bestehenden Serie besteht, kann die Verwendung von zentriertem Mas bevorzugt sein. Einfache gleitende Mittelwerte können als eine Form von Glättung, Entfernen einiger Hochfrequenzkomponenten einer Zeitreihe und Hervorhebung (aber nicht Entfernen) von Trends in einer ähnlichen Weise wie der allgemeine Begriff der digitalen Filterung betrachtet werden. Tatsächlich sind die gleitenden Mittelwerte eine Form eines linearen Filters. Es ist möglich, eine gleitende Durchschnittsberechnung auf eine Reihe anzuwenden, die bereits geglättet worden ist, d. h. Glätten oder Filtern einer bereits geglätteten Reihe. Zum Beispiel können wir mit einem gleitenden Mittelwert der Ordnung 2 es als berechnen mit Gewichten betrachten, so dass das MA bei x 2 0,5 x 1 0,5 x 2 gilt. Ebenso ist das MA bei x 3 0,5 x 2 0,5 x 3. Wenn wir Eine zweite Glättungs - oder Filterstufe anwenden, so haben wir 0,5 x 2 0,5 x 3 0,5 (0,5 x 1 0,5 x 2) 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3, dh die zweistufige Filterung Prozess (oder Faltung) einen variabel gewichteten symmetrischen gleitenden Durchschnitt mit Gewichten erzeugt hat. Mehrere Windungen können sehr komplexe gewichtete gleitende Durchschnittswerte erzeugen, von denen einige speziell in Spezialgebieten, wie etwa in Lebensversicherungsberechnungen, gefunden wurden. Bewegungsdurchschnitte können verwendet werden, um periodische Effekte zu entfernen, wenn sie mit der Länge der Periodizität als bekannt berechnet werden. Zum Beispiel können mit monatlichen Daten saisonale Schwankungen oft entfernt werden (wenn dies das Ziel ist), indem Sie eine symmetrische 12-monatigen gleitenden Durchschnitt mit allen Monaten gleichmäßig gewichtet, mit Ausnahme der ersten und letzten, die mit 1/2 gewichtet werden. Dies liegt daran, dass es 13 Monate im symmetrischen Modell (aktuelle Zeit, t / / 6 Monate). Die Gesamtzahl wird durch 12 geteilt. Ähnliche Verfahren können für jede wohldefinierte Periodizität angenommen werden. Exponentiell gewichtete Bewegungsdurchschnitte (EWMA) Mit der einfachen gleitenden Durchschnittsformel werden alle Beobachtungen gleich gewichtet. Wenn wir diese Gleichgewichte, alpha t. Würde jedes der k Gewichte gleich 1 / k sein. So dass die Summe der Gewichte würde 1, und die Formel wäre: Wir haben bereits gesehen, dass mehrere Anwendungen dieses Prozesses in die Gewichte variieren führen. Bei exponentiell gewichteten Bewegungsdurchschnitten wird der Beitrag zum Mittelwert aus mehr zeitlich entfernten Beobachtungen verringert, wodurch neuere (lokale) Ereignisse hervorgehoben werden. Im wesentlichen wird ein Glättungsparameter 0lt alpha lt1 eingeführt und die Formel überarbeitet: Eine symmetrische Version dieser Formel würde die Form haben: Wenn die Gewichte in dem symmetrischen Modell als die Ausdrücke der Ausdrücke der binomialen Expansion ausgewählt werden, (1/21/2) 2q. Sie summieren sich auf 1, und wenn q groß wird, nähert sich die Normalverteilung. Dies ist eine Form der Kerngewichtung, wobei das Binomial als Kernfunktion dient. Die im vorigen Teilabschnitt beschriebene zweistufige Faltung ist genau diese Anordnung, wobei q 1 die Gewichte ergibt. Bei der exponentiellen Glättung ist es notwendig, einen Satz von Gewichten zu verwenden, die auf 1 summieren und die geometrisch verkleinern. Die verwendeten Gewichte haben typischerweise die Form: Um zu zeigen, daß diese Gewichte zu 1 summieren, betrachten wir die Ausdehnung von 1 / als Folge. Wir können den Ausdruck in Klammern schreiben und erweitern, indem wir die binomische Formel (1- x) p verwenden. Wobei x (1) und p -1, was ergibt, ergibt sich daraus ein gewichtetes gleitendes Mittel der Form: Diese Summation kann als Rekursionsrelation geschrieben werden, was die Berechnung stark vereinfacht und das Problem vermeidet, dass das Gewichtungsregime Sollte strikt unendlich sein, damit die Gewichte auf 1 summieren (für kleine Werte von Alpha ist dies typischerweise nicht der Fall). Die von verschiedenen Autoren verwendete Schreibweise variiert. Einige verwenden den Buchstaben S, um anzuzeigen, daß die Formel im wesentlichen eine geglättete Variable ist, und schreiben: während die kontrolltheoretische Literatur oft Z anstelle von S für die exponentiell gewichteten oder geglätteten Werte verwendet (siehe z. B. Lucas und Saccucci, 1990, LUC1) , Und die NIST-Website für weitere Details und bearbeitete Beispiele). Die Formeln, die oben zitiert wurden, stammen aus der Arbeit von Roberts (1959, ROB1), aber Hunter (1986, HUN1) verwendet einen Ausdruck der Form, die für die Verwendung in einigen Kontrollverfahren geeigneter sein kann. Bei alpha 1 ist die mittlere Schätzung einfach ihr gemessener Wert (oder der Wert des vorherigen Datenelements). Bei 0,5 ist die Schätzung der einfache gleitende Durchschnitt der aktuellen und vorherigen Messungen. In Prognosemodellen wird der Wert S t. Wird oft als Schätzwert oder Prognosewert für die nächste Zeitperiode, dh als Schätzung für x zum Zeitpunkt t 1, verwendet. Somit haben wir: Dies zeigt, dass der Prognosewert zum Zeitpunkt t 1 eine Kombination des vorherigen exponentiell gewichteten gleitenden Durchschnitts ist Plus eine Komponente, die den gewichteten Vorhersagefehler darstellt, epsilon. Zum Zeitpunkt t. Wenn eine Zeitreihe gegeben wird und eine Prognose erforderlich ist, ist ein Wert für alpha erforderlich. Dies kann aus den vorhandenen Daten geschätzt werden, indem die Summe der quadrierten Prädiktionsfehler mit unterschiedlichen Werten von alpha für jedes t 2,3 ausgewertet wird. Wobei der erste Schätzwert der erste beobachtete Datenwert x ist. Bei Steueranwendungen ist der Wert von alpha wichtig, da er bei der Bestimmung der oberen und unteren Steuergrenzen verwendet wird und die erwartete durchschnittliche Lauflänge (ARL) beeinflusst Bevor diese Kontrollgrenzen unterbrochen werden (unter der Annahme, dass die Zeitreihe eine Menge von zufälligen, identisch verteilten unabhängigen Variablen mit gemeinsamer Varianz darstellt). Unter diesen Umständen ist die Varianz der Kontrollstatistik: (Lucas und Saccucci, 1990): Kontrollgrenzen werden gewöhnlich als feste Vielfache dieser asymptotischen Varianz festgelegt, z. B. / - das Dreifache der Standardabweichung. Wenn beispielsweise & alpha; 0,25 angenommen wird und die zu überwachenden Daten eine Normalverteilung, N (0,1) haben, wenn sie in der Steuerung sind, werden die Steuergrenzen / - 1,134 sein, und der Prozess wird eine oder andere Grenze in 500 erreichen Schritte im Durchschnitt. Lucas und Saccucci (1990 LUC1) leiten die ARLs für eine breite Palette von Alpha-Werten und unter verschiedenen Annahmen unter Verwendung von Markov-Chain-Prozeduren ab. Sie tabellieren die Ergebnisse, einschließlich der Bereitstellung von ARLs, wenn der Mittelwert des Kontrollprozesses um ein Vielfaches der Standardabweichung verschoben worden ist. Beispielsweise beträgt bei einer 0,5-Verschiebung mit alpha 0,25 die ARL weniger als 50 Zeitschritte. Die oben beschriebenen Ansätze sind als einzelne exponentielle Glättung bekannt. Da die Prozeduren einmal auf die Zeitreihe angewendet werden und dann Analysen oder Steuerprozesse auf dem resultierenden geglätteten Datensatz durchgeführt werden. Wenn der Datensatz einen Trend und / oder saisonale Komponenten enthält, kann eine zweidimensionale oder eine dreistufige Exponentialglättung angewandt werden, um diese Effekte zu entfernen (explizit modellieren) (siehe weiter unten im Abschnitt "Prognose" und "NIST") ). CHA1 Chatfield C (1975) Die Analyse der Zeitreihen: Theorie und Praxis. Chapman und Hall, London HUN1 Hunter J S (1986) Der exponentiell gewichtete gleitende Durchschnitt. J von Qualitätstechnologie, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) Exponentiell gewichtete gleitende durchschnittliche Kontrollschemata: Eigenschaften und Verbesserungen. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) Kontrolltests auf der Grundlage geometrischer Bewegungsdurchschnitte. Technometrics, 1, 239-2505.2 Glättungszeitreihe Die Glättung erfolgt in der Regel, um Muster, Trends beispielsweise in Zeitreihen besser zu sehen. Im Allgemeinen glätten Sie die unregelmäßige Rauheit, um ein klareres Signal zu sehen. Für saisonale Daten, könnten wir glätten die Saisonalität, so dass wir den Trend identifizieren können. Smoothing stellt uns nicht mit einem Modell, aber es kann ein guter erster Schritt bei der Beschreibung der verschiedenen Komponenten der Serie. Der Begriff Filter wird manchmal verwendet, um ein Glättungsverfahren zu beschreiben. Wenn zum Beispiel der geglättete Wert für eine bestimmte Zeit als eine lineare Kombination von Beobachtungen für Umgebungszeiten berechnet wird, kann man sagen, dass wir ein lineares Filter auf die Daten angewandt haben (nicht dasselbe wie das Ergebnis, dass das Ergebnis eine gerade Linie ist der Weg). Die traditionelle Verwendung des Begriffs gleitender Durchschnitt ist, dass wir zu jedem Zeitpunkt (möglicherweise gewichtete) Mittelwerte der beobachteten Werte bestimmen, die eine bestimmte Zeit umgeben. Zum Zeitpunkt t. Ein zentrierter gleitender Durchschnitt der Länge 3 mit gleichen Gewichten wäre der Mittelwert der Werte zu Zeiten t -1. T. Und t1. Um Saisonalität aus einer Serie wegzunehmen, so können wir besser sehen Trend, würden wir einen gleitenden Durchschnitt mit einer Länge Saisonspanne verwenden. Somit wurde in der geglätteten Reihe jeder geglättete Wert über alle Jahreszeiten gemittelt. Dies kann getan werden, indem man einen einseitigen gleitenden Durchschnitt betrachtet, in dem Sie alle Werte für die Werte der letzten Jahre oder einen zentrierten gleitenden Durchschnitt, in dem Sie Werte sowohl vor als auch nach der aktuellen Uhrzeit verwenden, mittlere. Für vierteljährliche Daten können wir beispielsweise einen geglätteten Wert für die Zeit t als (x t x t - 1 x t - 2 x t - 3) / 4, den Durchschnitt dieser Zeit und die vorhergehenden 3 Quartale, definieren. Im R-Code ist dies ein einseitiger Filter. Ein zentrierter gleitender Durchschnitt erzeugt ein wenig Schwierigkeit, wenn wir eine gerade Anzahl von Zeitperioden in der Saisonspanne haben (wie wir es normalerweise tun). Um Saisonalität in vierteljährlichen Daten zu glätten. Um Trend zu identifizieren, ist die übliche Konvention, den gleitenden Durchschnitt des gleitenden Mittels zum Zeitpunkt t zu verwenden, um Saisonalität in den Monatsdaten weg zu glätten. Um den Trend zu identifizieren, besteht die übliche Konvention darin, den zum Zeitpunkt t geglätteten gleitenden Durchschnitt zu verwenden. Das heißt, wir setzen das Gewicht 1/24 auf Werte zu Zeiten t6 und t6 und Gewicht 1/12 auf alle Werte zu allen Zeiten zwischen t5 und T5. In der R-Filter-Befehl, auch einen zweiseitigen Filter, wenn wir Werte, die sowohl vor als auch nach der Zeit, für die Glättung wurden verwendet werden. Beachten Sie, dass auf Seite 71 unseres Buches die Autoren gleiche Gewichte über einen zentrierten saisonalen gleitenden Durchschnitt anwenden. Das ist auch okay. Zum Beispiel kann eine vierteljährliche Glättung geglättet werden zum Zeitpunkt t ist Frac x frac x frac xt frac x frac x Ein monatlich glatter könnte ein Gewicht von 1/13 auf alle Werte von Zeiten t-6 bis t6 anwenden. Der Code, den die Autoren auf Seite 72 verwenden, nutzt einen rep-Befehl, der einen Wert eine bestimmte Anzahl von Malen wiederholt. Sie verwenden nicht den Filterparameter innerhalb des Filterbefehls. Beispiel 1 Vierteljährliche Bierproduktion in Australien In Lektion 1 und Lektion 4 haben wir eine Reihe von vierteljährlichen Bierproduktionen in Australien betrachtet. Der folgende R-Code erzeugt eine geglättete Reihe, die es ermöglicht, das Trendmuster zu sehen und dieses Trendmuster auf demselben Graphen wie die Zeitreihen aufzuzeichnen. Der zweite Befehl erstellt und speichert die geglättete Serie im Objekt namens trendpattern. Beachten Sie, dass innerhalb des Filterbefehls der Parameter namens filter die Koeffizienten für unsere Glättung und die Seiten 2 eine zentrierte Glättung ergibt. Beerprod scan (beerprod. dat) trendpattern filter (beerprod, filter c (1/8, 1/4, 1/4, 1/4, 1/8), seiten2) plot (beerprod, typ b, gleitender durchschnittlicher jährlicher trend ) Lines (trendpattern) Heres das Ergebnis: Wir können das Trendmuster von den Datenwerten subtrahieren, um einen besseren Einblick in die Saisonalität zu erhalten. Das Ergebnis: Eine weitere Möglichkeit zur Glättung von Reihen, um Trend zu sehen, ist der einseitige Filter trendpattern2 filter (beerprod, filter c (1/4, 1/4, 1/4, 1/4), seiten1) Damit ist der geglättete Wert der Durchschnitt des vergangenen Jahres. Beispiel 2. U. S. Monatliche Arbeitslosigkeit In den Hausaufgaben für Woche 4 sahen Sie eine monatliche Reihe von US-Arbeitslosigkeit für 1948-1978. Heres eine Glättung getan, um den Trend zu betrachten. Trendunemployfilter (arbeitslos, filterc (1 / 24,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12, (Trendunemploy, start c (1948,1), freq 12) Handlung (trendunemploy, mainTrend in US-Arbeitslosigkeit, 1948-1978, xlab-Jahr) Nur der geglättete Trend ist gezeichnet. Der zweite Befehl identifiziert die Kalenderzeitmerkmale der Serie. Das macht die Handlung eine sinnvollere Achse. Die Handlung folgt. Für nicht-saisonale Serien, Sie Arent gebunden, um über eine bestimmte Spanne glätten. Zur Glättung sollten Sie mit gleitenden Mittelwerten verschiedener Spannen experimentieren. Diese Zeitspannen könnten relativ kurz sein. Das Ziel ist, um die rauen Kanten zu klopfen, um zu sehen, welche Tendenz oder Muster dort sein könnte. Andere Glättungsmethoden (Abschnitt 2.4) Abschnitt 2.4 beschreibt einige anspruchsvolle und nützliche Alternativen zur gleitenden mittleren Glättung. Die Details können skizzenhaft erscheinen, aber das ist okay, weil wir nicht wollen, in vielen Details für diese Methoden zu erhalten. Von den alternativen Methoden, die in Abschnitt 2.4 beschrieben werden, kann die niedrigste (lokal gewichtete Regression) am häufigsten verwendet werden. Beispiel 2 Fortsetzung Das folgende Diagramm ist geglättet Trendlinie für die US-Arbeitslosen-Serie, gefunden mit einem Lowess Glättung, in dem eine erhebliche Menge (2/3) zu jedem geglättet Schätzung beigetragen. Beachten Sie, dass dies die Serie mehr aggressiv als die gleitenden Durchschnitt geglättet. Die Kommandos waren Arbeitslosigkeit ts (Arbeitslosigkeit, Anfang c (1948,1), freq12) Handlung (Lowess (Arbeitslosigkeit, f 2/3), Haupt Lowess Glättung der US-Arbeitslosigkeit Trend) Single Exponential Glättung Die grundlegende Vorhersagegleichung für einzelne exponentielle Glättung Wird oft als Hut gegeben alpha xt (1-alpha) hat t text Wir prognostizieren, dass der Wert von x zum Zeitpunkt t1 eine gewichtete Kombination des beobachteten Wertes zum Zeitpunkt t und des prognostizierten Wertes zum Zeitpunkt t ist. Obwohl die Methode eine Glättungsmethode genannt wird, wird sie hauptsächlich für Kurzzeitprognosen verwendet. Der Wert von heißt Glättungskonstante. Aus welchem ​​Grund auch immer, 0.2 ist eine beliebte Standard-Auswahl von Programmen. Dies ergibt ein Gewicht von 0,2 auf die neueste Beobachtung und ein Gewicht von 1,2,8 auf die jüngste Prognose. Bei einem relativ kleinen Wert wird die Glättung relativ umfangreicher sein. Bei einem relativ großen Wert ist die Glättung relativ weniger umfangreich, da mehr Gewicht auf den beobachteten Wert gesetzt wird. Dies ist eine einfache, einstufige Prognosemethode, die auf den ersten Blick kein Modell für die Daten erfordert. Tatsächlich ist dieses Verfahren äquivalent zu der Verwendung eines ARIMA (0,1,1) - Modells ohne Konstante. Das optimale Verfahren ist, ein ARIMA (0,1,1) Modell an den beobachteten Datensatz anzupassen und die Ergebnisse zu verwenden, um den Wert von zu bestimmen. Dies ist optimal im Sinne der Schaffung der besten für die bereits beobachteten Daten. Obwohl das Ziel eine Glättung und eine Vorausschätzung ist, bringt die Äquivalenz zum ARIMA-Modell (0,1,1) einen guten Punkt. Wir sollten nicht blind gelten exponentielle Glättung, weil die zugrunde liegende Prozess möglicherweise nicht gut modelliert werden durch eine ARIMA (0,1,1). ARIMA (0,1,1) und exponentielle Glättung Equivalence Betrachten wir ein ARIMA (0,1,1) mit einem Mittelwert von 0 für die ersten Differenzen, xt - x t-1: beginnen Hut amp amp xt theta1 wt amp amp xt theta1 (xt - hat t) amp amp (1 theta1) xt - theta1hat neigen. Wenn wir (1 1) und damit - (1) 1 zulassen, sehen wir die Äquivalenz zu Gleichung (1) oben. Warum ist die Methode der exponentiellen Glättung aufgerufen Daraus ergibt sich folgende: Hut amp amp alpha xt (1-alpha) alpha x (1-alpha) hat amp amp alpha xt alpha (1-alpha) x (1-alpha) 2hat Ende beginnen Weiter Auf diese Weise durch sukzessives Ersetzen des prognostizierten Wertes auf der rechten Seite der Gleichung. Dies führt zu: Hut alpha xt alpha (1-alpha) x alpha (1-alpha) 2 x dots alpha (1-alpha) jx Punkte alpha (1-alpha) x1 Text Gleichung 2 zeigt, dass der prognostizierte Wert ein gewichteter Durchschnitt ist Aller vergangenen Werte der Serie, mit exponentiell wechselnden Gewichten, wie wir zurück in der Serie bewegen. Optimale Exponentialglättung in R Grundsätzlich passen wir nur einen ARIMA (0,1,1) an die Daten an und bestimmen den Koeffizienten. Wir können die Anpassung der glatten durch Vergleich der vorhergesagten Werte mit der tatsächlichen Reihe untersuchen. Exponentielle Glättung neigt dazu, mehr als eine Prognose-Tool als eine echte glatte verwendet werden, so waren auf der Suche zu sehen, ob wir eine gute Passform haben. Beispiel 3. N 100 monatliche Beobachtungen zum Logarithmus eines Ölpreisindexes in den Vereinigten Staaten. Die Datenreihe ist: Eine Anpassung von ARIMA (0,1,1) in R ergab einen MA (1) - Koeffizienten von 0,3877. So (1 1) 1,3877 und 1- -0,3877. Die exponentielle Glättungsvorhersagegleichung ist Hut 1.3877xt - 0.3877hat t Zum Zeitpunkt 100 ist der beobachtete Wert der Reihe x 100 0.86601. Der vorhergesagte Wert für die Serie zu dieser Zeit ist also die Prognose für Zeit 101 Hut 1.3877x - 0.3877hat 1,3877 (0,86601) -0,3877 (0,856789) 0,8696 Es folgt, wie gut die glattere die Serie passt. Sein eine gute Passform. Das ist ein gutes Zeichen für die Prognose, der Hauptzweck für diese glatter. Hier sind die Befehle verwendet, um die Ausgabe für dieses Beispiel zu generieren: oilindex Scan (oildata. dat) Grundstück (oilindex, Typ b, Haupt Log Öl Index Series) expsmoothfit arima (oilindex, um c (0,1,1)) expsmoothfit Arima Ergebnisse predicteds oilindex zu sehen - expsmoothfitresiduals vorhergesagten Werte Grundstück (oilindex, TypeB, Haupt exponentielle Glättung von Log Öl Index) Linien (predicteds) 1.3877oilindex100-0.3877predicteds100 Prognose für die Zeit 101 Doppel exponentielle Glättung Doppel exponentielle Glättung könnte verwendet werden, wenn theres (Langfristig oder kurzfristig), aber keine Saisonalität. Im Wesentlichen schafft das Verfahren eine Prognose durch Kombinieren von exponentiell geglätteten Schätzungen des Trends (Steigung einer geraden Linie) und des Pegels (im Grunde des Abschnitts einer Geraden). Zur Aktualisierung dieser beiden Komponenten werden jeweils zwei verschiedene Gewichte oder Glättungsparameter verwendet. Das Glättungsniveau entspricht mehr oder weniger einer einfachen exponentiellen Glättung der Datenwerte, und der geglättete Trend entspricht mehr oder weniger einer einfachen exponentiellen Glättung der ersten Differenzen. Das Verfahren entspricht der Anpassung eines ARIMA (0,2,2) Modells, ohne Konstante kann es mit einem ARIMA (0,2,2) Fit durchgeführt werden. (1-B) 2 xt (1theta1B theta2B2) wt. Navigation


No comments:

Post a Comment