Monday, 13 August 2018

Moving average seasonal variation


Médias móveis Se essas informações forem plotadas em um gráfico, ele se parece com isto: Isso mostra que há uma grande variação no número de visitantes, dependendo da estação. Há muito menos no outono e inverno do que primavera e verão. No entanto, se quiséssemos ver uma tendência no número de visitantes, poderíamos calcular uma média móvel de 4 pontos. Fazemos isso encontrando o número médio de visitantes nos quatro trimestres de 2005: Então encontramos o número médio de visitantes nos últimos três trimestres de 2005 e primeiro trimestre de 2006: Então os dois últimos trimestres de 2005 e os dois primeiros trimestres de 2005 De 2006: Observe que a última média que podemos encontrar é para os dois últimos trimestres de 2006 e os dois primeiros trimestres de 2007. Traçamos as médias móveis em um gráfico, certificando-se de que cada média é plotada no centro dos quatro trimestres Ele abrange: Agora podemos ver que há uma tendência de queda muito ligeira em visitors. Spreadsheet implementação de ajuste sazonal e suavização exponencial É simples de executar ajuste sazonal e ajustar modelos de suavização exponencial usando Excel. As imagens e gráficos de tela a seguir são extraídos de uma planilha que foi configurada para ilustrar o ajuste sazonal multiplicativo e a suavização exponencial linear nos seguintes dados de vendas trimestrais do Outboard Marine: Para obter uma cópia do próprio arquivo de planilha, clique aqui. A versão de suavização exponencial linear que será usada aqui para fins de demonstração é a versão de Brown8217s, simplesmente porque ela pode ser implementada com uma única coluna de fórmulas e há apenas uma constante de suavização para otimizar. Normalmente é melhor usar a versão Holt8217s que tem constantes de suavização separadas para nível e tendência. O processo de previsão prossegue da seguinte forma: (i) primeiro os dados são ajustados sazonalmente (ii) então as previsões são geradas para os dados ajustados sazonalmente por meio de suavização exponencial linear e (iii) finalmente as previsões são ajustadas sazonalmente para obter previsões para a série original . O processo de ajuste sazonal é realizado nas colunas D a G. O primeiro passo no ajuste sazonal é calcular uma média móvel centrada (realizada aqui na coluna D). Isto pode ser feito tomando a média de duas médias anuais que são compensadas por um período em relação um ao outro. (Uma combinação de duas médias de compensação ao invés de uma única média é necessária para fins de centralização quando o número de estações é par.) O próximo passo é calcular a relação com a média móvel - i. e. Os dados originais divididos pela média móvel em cada período - o que é realizado aqui na coluna E. (Isso também é chamado de componente quottrend-cyclequot do padrão, na medida em que os efeitos da tendência e do ciclo de negócios podem ser considerados como sendo tudo isso Permanece após a média de dados de um ano inteiro. Naturalmente, as mudanças mês a mês que não são devido à sazonalidade poderia ser determinada por muitos outros fatores, mas a média de 12 meses suaviza sobre eles em grande medida.) O índice sazonal estimado para cada estação é calculado pela primeira média de todas as razões para essa estação particular, que é feita nas células G3-G6 usando uma fórmula AVERAGEIF. As razões médias são então redimensionadas de modo que somam exatamente 100 vezes o número de períodos em uma estação, ou 400, neste caso, o que é feito nas células H3-H6. Abaixo na coluna F, as fórmulas VLOOKUP são usadas para inserir o valor do índice sazonal apropriado em cada linha da tabela de dados, de acordo com o trimestre do ano que ele representa. A média móvel centrada e os dados ajustados sazonalmente acabam parecidos com isto: Note que a média móvel normalmente se parece com uma versão mais lisa da série ajustada sazonalmente, e é mais curta em ambas as extremidades. Uma outra planilha no mesmo arquivo do Excel mostra a aplicação do modelo de suavização exponencial linear aos dados dessazonalizados, começando na coluna G. Um valor para a constante de alisamento (alfa) é inserido acima da coluna de previsão (aqui, na célula H9) e Por conveniência é atribuído o nome do intervalo quotAlpha. quot (O nome é atribuído usando o comando quotInsert / Name / Createquot). O modelo LES é inicializado definindo as duas primeiras previsões iguais ao primeiro valor real da série ajustada sazonalmente. A fórmula usada aqui para a previsão de LES é a forma recursiva de equação única do modelo Brown8217s: Esta fórmula é inserida na célula correspondente ao terceiro período (aqui, célula H15) e copiada para baixo a partir daí. Observe que a previsão do LES para o período atual se refere às duas observações precedentes e aos dois erros de previsão anteriores, bem como ao valor de alfa. Assim, a fórmula de previsão na linha 15 refere-se apenas a dados que estavam disponíveis na linha 14 e anteriores. (É claro que, se desejássemos usar a suavização linear simples em vez de linear, poderíamos substituir a fórmula SES aqui. Também poderíamos usar Holt8217s ao invés do modelo LES de Brown8217s, o que exigiria mais duas colunas de fórmulas para calcular o nível ea tendência Que são usados ​​na previsão.) Os erros são computados na coluna seguinte (aqui, coluna J) subtraindo as previsões dos valores reais. O erro médio quadrático é calculado como a raiz quadrada da variância dos erros mais o quadrado da média. (Isto decorre da identidade matemática: VARIANCE MSE (erros) (AVERAGE (erros)) 2.) No cálculo da média e variância dos erros nesta fórmula, os dois primeiros períodos são excluídos porque o modelo não começa a prever até O terceiro período (linha 15 na planilha). O valor ótimo de alfa pode ser encontrado alterando manualmente alfa até que o RMSE mínimo seja encontrado, ou então você pode usar o quotSolverquot para executar uma minimização exata. O valor de alpha que o Solver encontrado é mostrado aqui (alpha0.471). Geralmente é uma boa idéia traçar os erros do modelo (em unidades transformadas) e também calcular e traçar suas autocorrelações em defasagens de até uma estação. Aqui está um gráfico de séries temporais dos erros (ajustados sazonalmente): As autocorrelações de erro são calculadas usando a função CORREL () para calcular as correlações dos erros com elas mesmas retardadas por um ou mais períodos - os detalhes são mostrados no modelo de planilha . Aqui está um gráfico das autocorrelações dos erros nos primeiros cinco lags: As autocorrelações nos intervalos 1 a 3 são muito próximas de zero, mas a espiga no retardo 4 (cujo valor é 0,35) é ligeiramente problemática - sugere que a Processo de ajuste sazonal não foi completamente bem sucedido. No entanto, é apenas marginalmente significativo. 95 para determinar se as autocorrelações são significativamente diferentes de zero são mais ou menos 2 / SQRT (n-k), onde n é o tamanho da amostra e k é o atraso. Aqui n é 38 e k varia de 1 a 5, então a raiz quadrada de - n-menos-k é de cerca de 6 para todos eles e, portanto, os limites para testar a significância estatística de desvios de zero são aproximadamente mais - Ou-menos 2/6, ou 0,33. Se você variar o valor de alfa à mão neste modelo do Excel, você pode observar o efeito sobre as parcelas de tempo de série e de autocorrelação dos erros, bem como sobre o erro raiz-médio-quadrado, que será ilustrado abaixo. Na parte inferior da planilha, a fórmula de previsão é quotbootstrappedquot para o futuro, simplesmente substituindo as previsões de valores reais no ponto onde os dados reais se esgotou - i. e. Onde o futuro começa. (Em outras palavras, em cada célula onde um valor de dados futuro ocorreria, uma referência de célula é inserida que aponta para a previsão feita para esse período.) Todas as outras fórmulas são simplesmente copiadas para baixo de cima: Observe que os erros para previsões de O futuro são todos computados como sendo zero. Isso não significa que os erros reais serão zero, mas sim apenas reflete o fato de que para fins de previsão estamos assumindo que os dados futuros serão iguais às previsões em média. As previsões de LES resultantes para os dados ajustados sazonalmente são as seguintes: Com este valor específico de alfa, que é ideal para as previsões de um período antecipado, a tendência projetada é ligeiramente alta, refletindo a tendência local observada nos últimos 2 anos ou então. Para outros valores de alfa, uma projeção de tendência muito diferente pode ser obtida. Geralmente é uma boa idéia ver o que acontece com a projeção de tendência de longo prazo quando alfa é variado, porque o valor que é melhor para previsão de curto prazo não será necessariamente o melhor valor para prever o futuro mais distante. Por exemplo, aqui está o resultado que é obtido se o valor de alfa é manualmente definido como 0.25: A tendência de longo prazo projetada é agora negativa em vez de positiva Com um menor valor de alfa, o modelo está colocando mais peso em dados mais antigos em A sua estimativa do nível e da tendência actuais e as suas previsões a longo prazo reflectem a tendência descendente observada nos últimos 5 anos, em vez da tendência ascendente mais recente. Este gráfico também ilustra claramente como o modelo com um valor menor de alfa é mais lento para responder a pontos de quoturno nos dados e, portanto, tende a fazer um erro do mesmo sinal para muitos períodos em uma linha. Seus erros de previsão de 1 passo são maiores em média do que aqueles obtidos antes (RMSE de 34,4 em vez de 27,4) e fortemente positivamente autocorrelacionados. A autocorrelação lag-1 de 0,56 excede largamente o valor de 0,33 calculado acima para um desvio estatisticamente significativo de zero. Como uma alternativa ao avanço do valor de alfa para introduzir mais conservadorismo em previsões de longo prazo, um fator quottrend de amortecimento é às vezes adicionado ao modelo para fazer a tendência projetada aplanar após alguns períodos. A etapa final na construção do modelo de previsão é a de igualar as previsões de LES, multiplicando-as pelos índices sazonais apropriados. Dessa forma, as previsões reseasonalized na coluna I são simplesmente o produto dos índices sazonais na coluna F e as previsões de LES estacionalmente ajustadas na coluna H. É relativamente fácil calcular intervalos de confiança para as previsões de um passo à frente feitas por este modelo: primeiro Calcular o RMSE (erro quadrático médio, que é apenas a raiz quadrada do MSE) e, em seguida, calcular um intervalo de confiança para a previsão ajustada sazonalmente, adicionando e subtraindo duas vezes o RMSE. (Em geral, um intervalo de confiança de 95 para uma previsão de um período antecipado é aproximadamente igual à previsão de ponto mais ou menos duas vezes o desvio padrão estimado dos erros de previsão, supondo que a distribuição do erro é aproximadamente normal eo tamanho da amostra É grande o suficiente, digamos, 20 ou mais. Aqui, o RMSE em vez do desvio padrão da amostra dos erros é a melhor estimativa do desvio padrão de futuros erros de previsão porque leva bias, bem como variações aleatórias em conta.) Os limites de confiança Para a previsão ajustada sazonalmente são então reseasonalized. Juntamente com a previsão, multiplicando-os pelos índices sazonais apropriados. Neste caso o RMSE é igual a 27,4 e a previsão ajustada sazonalmente para o primeiro período futuro (Dec-93) é 273,2. O intervalo de confiança ajustado sazonalmente é de 273,2-227,4 218,4 para 273,2227,4 328,0. Multiplicando esses limites por Decembers índice sazonal de 68,61. Obtemos limites de confiança inferior e superior de 149,8 e 225,0 em torno da previsão de ponto Dec-93 de 187,4. Os limites de confiança para as previsões de mais de um período de tempo em geral aumentarão à medida que o horizonte de previsão aumentar, devido à incerteza quanto ao nível e à tendência, bem como aos fatores sazonais, mas é difícil computá-los em geral por métodos analíticos. (A maneira apropriada de calcular limites de confiança para a previsão de LES é usando a teoria ARIMA, mas a incerteza nos índices sazonais é outra questão.) Se você quer um intervalo de confiança realista para uma previsão mais de um período à frente, tomando todas as fontes de A sua melhor aposta é usar métodos empíricos: por exemplo, para obter um intervalo de confiança para uma previsão de duas etapas à frente, você poderia criar outra coluna na planilha para calcular uma previsão de duas etapas para cada período ( Por bootstrapping a previsão one-step-ahead). Em seguida, calcule o RMSE dos erros de previsão em duas etapas e use isso como a base para um intervalo de confiança de 2 passos.6.2 Médias móveis 40 ordens elétricas, ordem 5 41 Na segunda coluna desta tabela, uma média móvel De ordem 5, proporcionando uma estimativa do ciclo de tendência. O primeiro valor nesta coluna é a média das cinco primeiras observações (1989-1993) o segundo valor na coluna 5-MA é a média dos valores 1990-1994 e assim por diante. Cada valor na coluna 5-MA é a média das observações no período de cinco anos centrado no ano correspondente. Não há valores para os dois primeiros anos ou últimos dois anos porque não temos duas observações de cada lado. Na fórmula acima, a coluna 5-MA contém os valores de hat com k2. Para ver como é a estimativa do ciclo tendencial, traçamos o gráfico juntamente com os dados originais da Figura 6.7. Lote 40 elecsales, principal quotResidential vendas de eletricidade, ylab quotGWhquot. Observe como a tendência (em vermelho) é mais suave do que os dados originais e captura o movimento principal da série de tempo sem todas as pequenas flutuações. O método da média móvel não permite estimativas de T em que t está próximo das extremidades da série, portanto, a linha vermelha não se estende para os bordos do gráfico em qualquer lado. Mais tarde usaremos métodos mais sofisticados de estimativa de tendência-ciclo que permitem estimativas próximas aos pontos finais. A ordem da média móvel determina a suavidade da estimativa de tendência-ciclo. Em geral, uma ordem maior significa uma curva mais suave. O gráfico a seguir mostra o efeito da alteração da ordem da média móvel para os dados de vendas de eletricidade residencial. As médias móveis simples como estas são normalmente de ordem ímpar (por exemplo, 3, 5, 7, etc.). Isto é assim que são simétricas: numa média móvel de ordem m2k1, há k observações anteriores, k observações posteriores e a observação do meio Que são médias. Mas se m fosse uniforme, não seria mais simétrico. Médias móveis de médias móveis É possível aplicar uma média móvel a uma média móvel. Uma razão para fazer isso é fazer uma média móvel de ordem uniforme simétrica. Por exemplo, podemos pegar uma média móvel de ordem 4 e, em seguida, aplicar outra média móvel de ordem 2 aos resultados. Na Tabela 6.2, isto foi feito para os primeiros anos dos dados da produção de cerveja trimestral australiana. Beer2 lt - window 40 ausbeer, início 1992 41 ma4 ltm 40 beer2, ordem 4. center FALSE 41 ma2x4 ltm 40 beer2, ordem 4. center TRUE 41 A notação 2times4-MA na última coluna significa um 4-MA Seguido por um 2-MA. Os valores na última coluna são obtidos tomando uma média móvel de ordem 2 dos valores na coluna anterior. Por exemplo, os dois primeiros valores na coluna 4-MA são 451,2 (443410420532) / 4 e 448,8 (410420532433) / 4. O primeiro valor na coluna 2times4-MA é a média destes dois: 450,0 (451.2448.8) / 2. Quando um 2-MA segue uma média móvel de ordem par (como 4), é chamado de média móvel centrada de ordem 4. Isto é porque os resultados são agora simétricos. Para ver que este é o caso, podemos escrever o 2times4-MA da seguinte forma: begin hat amp frac Bigfrac (y y y y) frac (y y y y) Big frac fray frac14y frac14y frac14y frac18y. Fim É agora uma média ponderada das observações, mas é simétrica. Outras combinações de médias móveis também são possíveis. Por exemplo, um 3 x 3 MA é frequentemente utilizado e consiste numa média móvel de ordem 3 seguida por outra média móvel de ordem 3. Em geral, uma ordem par MA deve ser seguida por uma ordem par MA para torná-lo simétrico. Similarmente, uma ordem ímpar MA deve ser seguida por uma ordem ímpar MA. Estimativa do ciclo de tendência com dados sazonais O uso mais comum de médias móveis centradas é estimar o ciclo de tendência a partir de dados sazonais. Considere o 2x4-MA: fracasso do chapéu frac14y frac14y frac14y frac18y. Quando aplicado a dados trimestrais, cada trimestre do ano recebe igual peso, uma vez que o primeiro eo último termo se aplicam ao mesmo trimestre em anos consecutivos. Conseqüentemente, a variação sazonal será média e os valores resultantes de hat t terão pouca ou nenhuma variação sazonal restante. Obter-se-ia um efeito semelhante utilizando uma mistura de 2 x 8-MA ou 2 x 12-MA. Em geral, uma m-MA 2x é equivalente a uma média móvel ponderada de ordem m1 com todas as observações tomando peso 1 / m, exceto para o primeiro e último termos que tomam pesos 1 / (2m). Portanto, se o período sazonal é par e de ordem m, use um m-MA de 2x para estimar o ciclo tendencial. Se o período sazonal é ímpar e de ordem m, use um m-MA para estimar o ciclo de tendência. Em particular, um 2 x 12-MA pode ser usado para estimar o ciclo de tendência de dados mensais e um 7-MA pode ser usado para estimar o ciclo tendência de dados diários. Outras escolhas para a ordem do MA normalmente resultarão em estimativas de ciclo de tendência sendo contaminadas pela sazonalidade nos dados. Exemplo 6.2 Fabricação de equipamento elétrico A Figura 6.9 mostra uma 2 x 12-MA aplicada ao índice de ordens de equipamentos elétricos. Observe que a linha lisa não mostra sazonalidade é quase o mesmo que o ciclo de tendência mostrado na Figura 6.2 que foi estimado usando um método muito mais sofisticado do que as médias móveis. Qualquer outra escolha para a ordem da média móvel (exceto 24, 36, etc.) teria resultado em uma linha suave que mostra algumas flutuações sazonais. Plot 40 elecequip, ylab quotNovas ordens indicequot. Col quotgrayquot, main quotred 41 Química média ponderada As médias combinadas das médias móveis resultam em médias móveis ponderadas. Por exemplo, o 2x4-MA discutido acima é equivalente a um 5-MA ponderado com pesos dados por frac, frac, frac, frac, frac. Em geral, uma m-MA ponderada pode ser escrita como hat t sum k aj y, onde k (m-1) / 2 e os pesos são dados por a, dots, ak. É importante que todos os pesos somem a um e que sejam simétricos para que aj a. O m-MA simples é um caso especial onde todos os pesos são iguais a 1 / m. Uma grande vantagem das médias móveis ponderadas é que elas produzem uma estimativa mais suave do ciclo tendencial. Em vez das observações que entram e que deixam o cálculo no peso cheio, seus pesos são aumentados lentamente e então lentamente diminuídos resultando em uma curva mais lisa. Alguns conjuntos específicos de pesos são amplamente utilizados. Alguns deles são dados na Tabela 6.3.Como posso calcular a variação sazonal de uma média móvel de 4 pontos Se eu tiver uma lista de vendas por trimestre durante 2 anos, digamos. A partir destes dados eu posso calcular as médias móveis de 4 pontos Geralmente, as vendas - média móvel (tendência) variação sazonal e isso teria sido fácil se eu tivesse feito 3 ou 5 pontos médias móveis (ou seja, número ímpar) Número ímpar: Vendas. Tendência. Sazonal. Mostre mais Se eu tenho uma lista de vendas por trimestre por 2 anos, digamos. A partir destes dados eu posso calcular as médias móveis de 4 pontos Geralmente, as vendas - média móvel (tendência) variação sazonal e isso teria sido fácil se eu tivesse feito 3 ou 5 pontos de médias móveis (ou seja, número ímpar) de vendas. Tendência. Variação sazonal x. uma. Dy. B. E z. C. F Vendas. Tendência. Variação sazonal x. A y. B z Só tomo uma média móvel de 2 pontos da tendência para obter os números no alinhamento Desculpe, espero que você entenda a minha pergunta It039s um pouco difícil de explicar. Melhor resposta: Como você percebeu, com uma média móvel de três ou cinco pontos, seus pontos de dados estão alinhados com seus dados originais. Bem, a média móvel de quatro pontos dar-lhe-ia uma linha de tendência com pontos de dados alinhados a meio caminho entre os pontos médios de seus dados originais e então eu acho que você deve interpolar entre os pontos de dados de média móvel. Uma vez que os pontos de dados da média móvel estão uniformemente espaçados em ambos os lados dos dados originais, a interpolação envolve a média de pontos sucessivos, então eu concordo com sua proposta de tomar uma média móvel de dois pontos como meio de calcular a tendência. Gostaria, no entanto, referir-se a ele como interpolação em vez de como uma média móvel. John middot 7 anos atrás Como faço para calcular a variação sazonal de uma média móvel de 4 pontos Se eu tiver uma lista de vendas por trimestre por 2 anos, digamos. A partir destes dados eu posso calcular as médias móveis de 4 pontos Geralmente, as vendas - média móvel (tendência) variação sazonal e isso teria sido fácil se eu tivesse feito 3 ou 5 pontos de médias móveis (ou seja, número ímpar) de vendas. Tendência. Variação sazonal x. uma. Dy. B. E z. C. F Vendas. Tendência. Variação sazonal x. A y. bz Do eu só dou uma média móvel de 2 ponto de a tendência para obter os números no alinhamento Desculpe, espero que você entenda a minha pergunta It039s um pouco difícil de explicar Adicionar uma média média answermoving de dados de séries temporais (observações igualmente espaçados no tempo) de vários Períodos consecutivos. Chamado de movimento porque é continuamente recalculado à medida que novos dados se tornam disponíveis, ele progride caindo o valor mais antigo e adicionando o valor mais recente. Por exemplo, a média móvel das vendas de seis meses pode ser calculada tomando a média das vendas de janeiro a junho, depois a média das vendas de fevereiro a julho, depois de março a agosto, e assim por diante. As médias móveis (1) reduzem o efeito de variações temporárias nos dados, (2) melhoram o ajuste dos dados para uma linha (um processo chamado suavização) para mostrar a tendência dos dados mais claramente e (3) realçam qualquer valor acima ou abaixo do valor tendência. Se você está calculando algo com variação muito alta o melhor que você pode ser capaz de fazer é descobrir a média móvel. Eu queria saber qual era a média móvel dos dados, então eu teria uma melhor compreensão de como estávamos fazendo. Quando você está tentando descobrir alguns números que mudam muitas vezes o melhor que você pode fazer é calcular a média móvel. O melhor de BusinessDictionary, entregue diariamente

No comments:

Post a Comment