Previsão - Média Móvel Integrada Autoregressiva (ARIMA) Neste artigo Este serviço implementa a Média Móvel Integrada Autoregressiva (ARIMA) para produzir previsões com base nos dados históricos fornecidos pelo usuário. Será que a demanda por um produto específico aumentar este ano Posso prever minhas vendas de produtos para a época do Natal, para que eu possa efetivamente planejar meu inventário Modelos de previsão são capazes de abordar essas questões. Dados os dados anteriores, esses modelos examinam tendências ocultas e sazonalidade para prever as tendências futuras. Experimente o Azure Machine Learning gratuitamente. Nenhum cartão de crédito ou assinatura Azure é necessário. Comece agora gt Este serviço da Web pode ser consumido por usuários potencialmente através de um aplicativo para dispositivos móveis, por meio de um site, ou mesmo em um computador local, por exemplo. Mas a finalidade do serviço da correia fotorreceptora é servir também como um exemplo de como o aprendizado da máquina de Azure pode ser usado criar serviços da correia fotorreceptora sobre o código de R. Com apenas algumas linhas de código R e cliques de um botão no Azure Machine Learning Studio, uma experiência pode ser criada com o código R e publicada como um serviço da web. O serviço web pode então ser publicado para o Azure Marketplace e consumido por usuários e dispositivos em todo o mundo sem a instalação da infra-estrutura pelo autor do serviço web. Consumo de serviço web Este serviço aceita 4 argumentos e calcula as previsões ARIMA. Os argumentos de entrada são: Freqüência - Indica a freqüência dos dados brutos (diária / semanal / mensal / trimestral / anual). Horizon - Previsão de tempo futuro. Data - Adicione os novos dados da série de tempo para o tempo. Valor: adicione os novos valores de dados da série temporal. A saída do serviço é os valores de previsão calculados. Entrada de amostra poderia ser: Freqüência - 12 Horizon - 12 Data - 15/01/20122/15/20123/15/20124/15/20125/15/20126/15/20127/15/20128/15/20129/15/201210 / 15/2012/2011/2011/2011/2011/2011/2011/2011/2011/2011/2011/2011/2011/2011 / 15/201311/15/201312/15/2013 1/15/20142/15/20143/15/20144/15/20145/15/20146/15/20147/15/20148/15/20149/15/2014 Valor - 3.4793.683.8323.9413.7973.5863.5083.7313.9153.8443.6343.5493.5573.7853.7823.6013.5443.5563.653.7093.6823.511 3.4293.513.5233.5253.6263.6953.7113.7113.6933.5713.509 Este serviço, como hospedado no Mercado Azure, é um serviço OData estes podem Ser chamado através de métodos POST ou GET. Existem várias maneiras de consumir o serviço de forma automatizada (um exemplo de aplicativo está aqui). Iniciando o código C para o consumo de serviços da web: Criação de serviço web Este serviço da web foi criado usando o Azure Machine Learning. Para uma avaliação gratuita, bem como vídeos introdutórios sobre a criação de experiências e publicação de serviços da web. Por favor veja azure / ml. Abaixo está uma captura de tela da experiência que criou o serviço da web eo código de exemplo para cada um dos módulos dentro da experiência. A partir do Azure Machine Learning, foi criada uma nova experiência em branco. Os dados de entrada de amostra foram carregados com um esquema de dados predefinido. Ligado ao esquema de dados é um módulo Execute R Script, que gera o modelo de previsão ARIMA usando auto. arima e funções de previsão a partir de R. Fluxo de experiência: Limitações Este é um exemplo muito simples para previsão ARIMA. Como pode ser visto a partir do código de exemplo acima, nenhuma captura de erro é implementada, e o serviço assume que todas as variáveis são contínuas / valores positivos ea freqüência deve ser um inteiro maior que 1. O comprimento dos vetores de data e valor deve ser o mesmo. A variável data deve aderir ao formato mm / dd / aaaa. Para as perguntas mais frequentes sobre consumo do serviço web ou publicação no mercado, veja aqui. Modelos ARIMA sazonais gerais: (0,1,1) x (0,1,1) etc. Esboço da modelagem ARIMA sazonal: A parte sazonal de Um modelo ARIMA tem a mesma estrutura que a parte não sazonal: pode ter um fator AR, um fator MA e / ou uma ordem de diferenciação. Na parte sazonal do modelo, todos esses fatores operam em múltiplos de lag s (o número de períodos em uma estação). Um modelo ARIMA sazonal é classificado como um modelo ARIMA (p, d, q) x (P, D, Q), onde Pnúmero de termos sazonais autorregressivos (SAR), Dnúmero de diferenças sazonais, Ao identificar um modelo sazonal, o primeiro passo é determinar se é necessária ou não uma diferença sazonal, além ou talvez em vez de uma diferença não sazonal. Você deve olhar as parcelas de séries temporais e os gráficos ACF e PACF para todas as combinações possíveis de 0 ou 1 diferença não sazonal e 0 ou 1 diferença sazonal. Cuidado: nunca use mais de uma diferença sazonal, nem mais do que duas diferenças totais (sazonal e não sazonal combinado). Se o padrão sazonal é forte e estável ao longo do tempo (por exemplo, alta no verão e baixa no inverno, ou vice-versa), então você provavelmente deve usar uma diferença sazonal, independentemente de usar uma diferença não sazonal, uma vez que isso vai Evitar o padrão sazonal de quotdying outquot nas previsões de longo prazo. Regra 12: Se a série tem um padrão sazonal forte e consistente, então você deve usar uma ordem de diferenciação sazonal - mas nunca use mais de uma ordem de diferenciação sazonal ou mais de 2 Ordens de diferenças totais (sazonais). A assinatura do SAR puro ou do comportamento SMA puro é semelhante à assinatura de RA puro ou comportamento MA puro, exceto que o padrão aparece em múltiplos de lag s no ACF e PACF. Por exemplo, um processo SAR puro (1) tem picos no ACF em defasagens s, 2s, 3s, etc. enquanto o PACF corta após o atraso s. Inversamente, um processo puro de SMA (1) tem picos no PACF em defasagens s, 2s, 3s, etc., enquanto o ACF corta após o atraso s. Uma assinatura SAR geralmente ocorre quando a autocorrelação no período sazonal é positiva, ao passo que uma assinatura SMA geralmente ocorre quando a autocorrelação sazonal é negativa. Portanto: Regra 13: Se a autocorrelação no período sazonal é positiva. Considere a adição de um termo SAR ao modelo. Se a autocorrelação no período sazonal é negativa. Considere a adição de um termo SMA para o modelo. Tente evitar misturar os termos SAR e SMA no mesmo modelo e evite usar mais de um dos dois tipos. Geralmente, um termo SAR (1) ou SMA (1) é suficiente. Você raramente encontrará um processo SAR genuíno (2) ou SMA (2), e ainda mais raramente terá dados suficientes para estimar 2 ou mais coeficientes sazonais sem que o algoritmo de estimação entre em um loop quotfeedback. Embora um modelo ARIMA sazonal pareça ter Apenas alguns parâmetros, lembre-se que backforecasting requer a estimativa de uma ou duas estações vale de parâmetros implícitos para inicializá-lo. Portanto, você deve ter pelo menos 4 ou 5 temporadas de dados para caber um modelo ARIMA sazonal. Provavelmente o modelo ARIMA sazonal mais comumente usado é o modelo (0,1,1) x (0,1,1) - isto é. Um modelo MA (1) xSMA (1) com uma diferença sazonal e não sazonal. Este é essencialmente um modelo de suavização exponencial quotseasonal. Quando os modelos ARIMA sazonais são ajustados a dados registrados, eles são capazes de rastrear um padrão sazonal multiplicativo. Exemplo: série AUTOSALE revisitada Lembre-se de que anteriormente previamos a série de vendas de varejo de automóveis usando uma combinação de deflação, ajuste sazonal e suavização exponencial. Vamos agora tentar montar a mesma série com modelos ARIMA sazonais, usando a mesma amostra de dados de janeiro de 1970 a maio de 1993 (281 observações). Como antes vamos trabalhar com vendas deflated auto - i. e. Vamos usar a série AUTOSALE / CPI como a variável de entrada. Aqui estão o enredo de séries temporais e os gráficos ACF e PACF da série original, que são obtidos no procedimento de Previsão, traçando os quotresiduais de um modelo ARIMA (0,0,0) x (0,0,0) com constante: Quotsuspension bridgequot padrão no ACF é típico de uma série que é tanto nonstationary e fortemente sazonal. É evidente que precisamos de pelo menos uma ordem de diferenciação. Se considerarmos uma diferença não sazonal, as parcelas correspondentes são as seguintes: A série diferenciada (os resíduos de um modelo randômico-caminhada-com-crescimento) parece mais ou menos estacionária, mas ainda há autocorrelação muito forte no período sazonal (Intervalo 12). Como o padrão sazonal é forte e estável, sabemos (da Regra 12) que queremos usar uma ordem de diferenciação sazonal no modelo. Aqui está a aparência da imagem depois de uma diferença sazonal (apenas): A série sazonalmente diferenciada mostra um padrão muito forte de autocorrelação positiva, como lembramos de nossa tentativa anterior de encaixar um modelo de caminhada aleatória sazonal. Isso poderia ser uma assinatura quotAR - ou poderia sinalizar a necessidade de outra diferença. Se considerarmos uma diferença sazonal e não sazonal, obtemos os seguintes resultados: Estes são, naturalmente, os resíduos do modelo de tendência aleatória sazonal que nós ajustamos aos dados de vendas de automóveis anteriormente. Agora vemos os sinais indicadores de overdifferencing suave. Os picos positivos no ACF e no PACF tornaram-se negativos. Qual é a ordem correta de diferenciação? Uma outra peça de informação que pode ser útil é um cálculo das estatísticas de erro da série em cada nível de diferenciação. Podemos calculá-los ajustando os correspondentes modelos ARIMA nos quais apenas é utilizada a diferenciação: Os menores erros, tanto no período de estimação quanto no período de validação, são obtidos pelo modelo A, que utiliza uma diferença de cada tipo. Isto, juntamente com o aparecimento das parcelas acima, sugere fortemente que devemos usar uma diferença sazonal e não sazonais. Observe que, exceto para o termo constante gratuíto, o modelo A é o modelo de tendência aleatória sazonal (SRT), enquanto o modelo B é apenas o modelo de caminhada aleatória sazonal (SRW). Como observamos anteriormente ao comparar esses modelos, o modelo SRT parece se encaixar melhor do que o modelo SRW. Na análise que se segue, vamos tentar melhorar esses modelos através da adição de termos sazonais ARIMA. Voltar ao topo da página. O modelo ARIMA (0,1,1) x (0,1,1) frequentemente usado: modelo SRT mais MA (1) e SMA (1) termos Retornando ao último conjunto de gráficos acima, observe que com uma diferença de Cada tipo existe um pico negativo no ACF no intervalo 1 e também um pico negativo no ACF no retardo 12. Enquanto que o PACF mostra um padrão mais gradual na vizinhança de ambos estes atrasos. Aplicando nossas regras para identificar modelos ARIMA (especificamente, Regra 7 e Regra 13), podemos agora concluir que o modelo SRT seria melhorado pela adição de um termo MA (1) e também um termo SMA (1). Além disso, pela Regra 5, excluímos a constante, uma vez que estão envolvidas duas ordens de diferenciação. Se fizermos tudo isso, obtemos o modelo ARIMA (0,1,1) x (0,1,1). Que é o modelo ARIMA sazonal mais utilizado. Sua equação de previsão é: onde 952 1 é o coeficiente MA (1) e 920 1 (capital theta-1) é o coeficiente SMA (1). Observe que este é apenas o modelo de tendência aleatória sazonal adotado pela adição de múltiplos dos erros nos intervalos 1, 12 e 13. Além disso, observe que o coeficiente do erro lag-13 é o produto do MA (1) e SMA (1). Este modelo é conceitualmente similar ao modelo de Winters, na medida em que aplica efetivamente o alisamento exponencial ao nível, à tendência e à sazonalidade de uma só vez, embora assente em bases teóricas mais sólidas, particularmente no que se refere ao cálculo dos intervalos de confiança para previsões de longo prazo. As suas parcelas residuais neste caso são as seguintes: Embora uma pequena quantidade de autocorrelação permaneça no retardo 12, o aspecto geral das parcelas é bom. Os resultados do ajuste do modelo mostram que os coeficientes MA (1) e SMA (1) estimados (obtidos após 7 iterações) são realmente significativos: As previsões do modelo se assemelham às do modelo de tendência aleatória sazonal - i. e. Eles pegar o padrão sazonal ea tendência local no final da série -, mas eles são um pouco mais suave na aparência, uma vez que tanto o padrão sazonal ea tendência estão sendo efetivamente média (em um tipo de suavização exponencial) durante o último Algumas temporadas: O que esse modelo realmente está fazendo Você pode pensar nisso da seguinte maneira. Primeiro, calcula a diferença entre o valor de cada mês e uma média histórica ponderada exponencial 8222 para aquele mês que é calculado aplicando-se a suavização exponencial a valores que foram observados no mesmo mês em anos anteriores, onde a quantidade de suavização é determinada pela SMA ). Em seguida, aplica uma suavização exponencial simples a essas diferenças para prever o desvio da média histórica que será observada no próximo mês. O valor do coeficiente SMA (1) próximo de 1,0 sugere que muitas estações de dados estão sendo usadas para calcular a média histórica para um dado mês do ano. Lembre-se que um coeficiente MA (1) em um modelo ARIMA (0,1,1) corresponde a 1-menos-alfa no modelo de suavização exponencial correspondente e que a idade média dos dados em um modelo de suavização exponencial é de 1 / alfa. O coeficiente SMA (1) tem uma interpretação similar em relação às médias entre as estações. Aqui seu valor de 0,91 sugere que a idade média dos dados utilizados para estimar o padrão sazonal histórico é um pouco mais de 10 anos (quase metade do comprimento do conjunto de dados), o que significa que um padrão sazonal quase constante está sendo assumido. O valor muito menor de 0,5 para o coeficiente MA (1) sugere que relativamente pouco alisamento está sendo feito para estimar o desvio atual da média histórica para o mesmo mês, de modo próximo mês 8217s previu desvio de sua média histórica será perto dos desvios Da média histórica observada nos últimos meses. Modelo ARIMA (1,0,0) x (0,1,0) com constante: modelo SRW mais AR (1) termo O modelo anterior foi um modelo de tendência aleatória sazonal (SRT) ajustado pela adição de MA 1) e SMA (1). Um modelo ARIMA alternativo para esta série pode ser obtido substituindo um termo AR (1) pela diferença não sazonal - isto é. Adicionando um termo AR (1) ao modelo Random Walk (SRW) sazonal. Isso nos permitirá preservar o padrão sazonal no modelo, ao mesmo tempo em que diminui a quantidade total de diferenciação, aumentando assim a estabilidade das projeções de tendência, se desejado. (Lembre-se que com uma única diferença sazonal, a série mostrou uma forte assinatura AR (1).) Se fizermos isso, obtemos um modelo ARIMA (1,0,0) x (0,1,0) com constante, Que produz os seguintes resultados: O coeficiente AR (1) é de fato altamente significativo eo RMSE é apenas 2,06, comparado a 3,00 para o modelo SRW (Modelo B no relatório de comparação acima). A equação de previsão para este modelo é: O termo adicional no lado direito é um múltiplo da diferença sazonal observada no último mês, o que tem o efeito de corrigir a previsão para o efeito de um ano anormalmente bom ou mau. Aqui 981 1 denota o coeficiente AR (1), cujo valor estimado é 0,73. Assim, por exemplo, se as vendas no mês passado fossem X dólares à frente das vendas um ano antes, então a quantidade 0.73X seria adicionada à previsão para este mês. 956 denota o CONSTANTE na equação de previsão, cujo valor estimado é 0,20. A MEAN estimada, cujo valor é 0,75, é o valor médio das séries sazonalmente diferenciadas, que é a tendência anual nas previsões de longo prazo deste modelo. A constante é (por definição) igual à média vezes 1 menos o coeficiente AR (1): 0,2 0,75 (1 8211 0,73). O gráfico de previsão mostra que o modelo realmente faz um trabalho melhor do que o modelo SRW de rastreamento de mudanças cíclicas (isto é, anormalmente bons ou maus anos): No entanto, o MSE para este modelo ainda é significativamente maior do que o obtido para o ARIMA (0, 1,1) x (0,1,1). Se olharmos para as parcelas de resíduos, veremos espaço para melhorias. Os resíduos ainda mostram algum sinal de variação cíclica: A ACF e PACF sugerem a necessidade de ambos os coeficientes MA (1) e SMA (1): Uma versão melhorada: ARIMA (1,0,1) x (0,1,1) Com constante Se adicionarmos os termos MA (1) e SMA (1) indicados ao modelo precedente, obtemos um modelo ARIMA (1,0,1) x (0,1,1) com constante, cuja equação de previsão é This É quase o mesmo que o modelo ARIMA (0,1,1) x (0,1,1), exceto que ele substitui a diferença não sazonal por um termo AR (1) (uma diferença quotpartial) e incorpora um termo constante representando o Tendência de longo prazo. Assim, este modelo assume uma tendência mais estável que o modelo ARIMA (0,1,1) x (0,1,1), e essa é a principal diferença entre eles. Os resultados do ajuste do modelo são os seguintes: Observe que o coeficiente estimado de AR (1) (981 1 na equação do modelo) é 0,96, que é muito próximo de 1,0, mas não tão próximo do que sugere que ele deve ser absolutamente substituído Uma primeira diferença: seu erro padrão é 0,02, então é cerca de 2 erros padrão de 1,0. As outras estatísticas do modelo (os coeficientes estimados de MA (1) e SMA (1) e as estatísticas de erro nos períodos de estimação e de validação) são quase idênticas às do ARIMA (0,1,1) x (0,1 , 1) modelo. (Os coeficientes estimados MA (1) e SMA (1) são 0,45 e 0,91 neste modelo versus 0,48 e 0,91 no outro.) A MEAN estimada de 0,68 é a tendência de longo prazo prevista (aumento anual médio). Este é essencialmente o mesmo valor que foi obtido no modelo (1,0,0) x (0,1,0) com constante. O erro padrão da média estimada é 0,26, portanto a diferença entre 0,75 e 0,68 não é significativa. Se a constante não fosse incluída neste modelo, seria um modelo de tendência atenuada: a tendência em suas previsões de muito longo prazo iria gradualmente se esvaindo. As previsões pontuais deste modelo parecem bastante semelhantes às do modelo (0,1,1) x (0,1,1), porque a tendência média é semelhante à tendência local no final da série. No entanto, os intervalos de confiança para este modelo aumentam um pouco menos rapidamente devido ao seu pressuposto de que a tendência é estável. Observe que os limites de confiança para as previsões de dois anos em frente agora permanecem dentro das linhas de grade horizontal em 24 e 44, enquanto que os do modelo (0,1,1) x (0,1,1) não: ARIMA sazonal Versus suavização exponencial e ajuste sazonal: Agora vamos comparar o desempenho dos dois melhores modelos ARIMA contra modelos de suavização exponencial simples e linear acompanhados de ajuste sazonal multiplicativo, eo modelo de Winters, como mostrado nas lâminas de previsão com ajuste sazonal: As estatísticas de erro para As previsões de um período antecipado para todos os modelos estão extremamente próximas neste caso. É difícil escolher um 8220winner8221 com base nesses números sozinho. Voltar ao topo da página. Quais são os tradeoffs entre os vários modelos sazonais Os três modelos que usam o ajuste sazonal multiplicativo lidar com a sazonalidade de uma forma explícita - ou seja. Os índices sazonais são explodidos como uma parte explícita do modelo. Os modelos ARIMA lidar com a sazonalidade de forma mais implícita - não podemos facilmente ver na saída ARIMA como a média de dezembro, digamos, difere da média de julho. Dependendo se é considerado importante isolar o padrão sazonal, isso pode ser um fator na escolha entre os modelos. Os modelos ARIMA têm a vantagem de que, uma vez inicializados, eles têm menos peças quotmoving do que os modelos exponenciais de suavização e ajuste e, como tal, eles podem ser menos propensos a sobrecarregar os dados. Os modelos ARIMA também têm uma teoria subjacente mais sólida no que se refere ao cálculo dos intervalos de confiança para previsões de horizonte mais longo do que os outros modelos. Há diferenças mais dramáticas entre os modelos com relação ao comportamento de suas previsões e intervalos de confiança para as previsões de mais de um período no futuro. Este é o lugar onde as suposições que são feitas com relação às mudanças na tendência e padrão sazonal são muito importantes. Entre os dois modelos ARIMA, um (modelo A) estima uma tendência variável no tempo, enquanto o outro (modelo B) incorpora uma tendência média a longo prazo. (Poderíamos, se desejássemos, nivelar a tendência de longo prazo no modelo B, suprimindo o termo constante.) Entre os modelos de suavização-mais-ajuste exponencial, um (modelo C) assume uma tendência plana, enquanto o outro Modelo D) assume uma tendência variável no tempo. O modelo de Winters (E) também assume uma tendência variável no tempo. Modelos que assumem uma tendência constante são relativamente mais confiantes em suas previsões de longo prazo do que modelos que não, e isso geralmente será refletido na medida em que os intervalos de confiança para as previsões se tornam mais amplos em horizontes de previsão mais longos. Modelos que não assumem tendências que variam no tempo geralmente têm intervalos de confiança mais estreitos para previsões de horizonte mais longo, mas mais estreitos não são melhores a menos que esta suposição esteja correta. Os dois modelos de suavização exponencial combinados com o ajuste sazonal pressupõem que o padrão sazonal permaneceu constante ao longo dos 23 anos na amostra de dados, enquanto que os outros três não. Na medida em que o padrão sazonal é responsável pela maior parte da variação mensal nos dados, é importante que se faça a previsão do que acontecerá vários meses no futuro. Se se acredita que o padrão sazonal mudou lentamente ao longo do tempo, outra abordagem seria usar apenas um histórico de dados mais curto para ajustar os modelos que estimam índices sazonais fixos. Para o registro, aqui estão as previsões e 95 limites de confiança para maio de 1995 (24 meses adiante) que são produzidos pelos cinco modelos: As previsões de ponto são realmente surpreendentemente próximas uma à outra, em relação às larguras de todos os intervalos de confiança. A previsão do ponto SES é a mais baixa, pois é o único modelo que não assume uma tendência ascendente no final da série. O modelo ARIMA (1,0,1) x (0,1,1) c possui os limites de confiança mais estreitos, pois assume menor variação de tempo nos parâmetros do que os outros modelos. Além disso, sua previsão pontual é ligeiramente maior do que a dos outros modelos, pois está extrapolando uma tendência de longo prazo, e não uma tendência de curto prazo (ou tendência zero). O modelo de Winters é o menos estável dos modelos e sua previsão tem, portanto, os limites de confiança mais amplos, como foi evidente nos gráficos de previsão detalhados para os modelos. E as previsões e os limites de confiança do modelo ARIMA (0,1,1) x (0,1,1) e os do modelo de ajuste LESseasonal são praticamente idênticos Logar ou não registrar Alguma coisa que ainda não fizemos, mas Pode ter, é incluir uma transformação log como parte do modelo. Os modelos ARIMA sazonais são modelos inerentemente aditivos, portanto, se quisermos capturar um padrão sazonal multiplicativo. Devemos fazê-lo registrando os dados antes da montagem do modelo ARIMA. Neste caso, a transformação de deflação parece ter feito um trabalho satisfatório de estabilização das amplitudes dos ciclos sazonais, por isso não há Parecem ser uma razão convincente para adicionar uma transformação de log, tanto quanto as tendências de longo prazo estão em causa. Se os resíduos mostraram um acentuado aumento na variância ao longo do tempo, poderíamos decidir o contrário. Ainda há uma questão de saber se os erros desses modelos têm uma variação consistente entre meses do ano. Se eles don8217t, então os intervalos de confiança para as previsões podem tender a ser muito grande ou muito estreito de acordo com a época. As parcelas residual-vs-tempo não mostram um problema óbvio a este respeito, mas para ser minucioso, seria bom olhar para a variância erro por mês. Se houver realmente um problema, uma transformação de log pode corrigi-lo. Modelos de média móvel (modelos MA) Modelos de séries temporais conhecidos como modelos ARIMA podem incluir termos auto-regressivos e / ou termos de média móvel. Na Semana 1, aprendemos um termo autorregressivo em um modelo de série temporal para a variável x t é um valor retardado de x t. Por exemplo, um termo autorregressivo de atraso 1 é x t-1 (multiplicado por um coeficiente). Esta lição define termos de média móvel. Um termo de média móvel em um modelo de séries temporais é um erro passado (multiplicado por um coeficiente). Vamos (wt overset N (0, sigma2w)), significando que os w t são identicamente, distribuídos independentemente, cada um com uma distribuição normal com média 0 e a mesma variância. O modelo de média móvel da 1ª ordem, denotado por MA (1) é (xt mu wt theta1w) O modelo de média móvel de 2ª ordem, denotado por MA (2) é (xt mu wt theta1w theta2w) , Denotado por MA (q) é (xt mu wt theta1w theta2w pontos thetaqw) Nota. Muitos livros didáticos e programas de software definem o modelo com sinais negativos antes dos termos. Isso não altera as propriedades teóricas gerais do modelo, embora ele inverta os sinais algébricos de valores de coeficientes estimados e de termos (não-quadrados) nas fórmulas para ACFs e variâncias. Você precisa verificar o software para verificar se sinais negativos ou positivos foram utilizados para escrever corretamente o modelo estimado. R usa sinais positivos em seu modelo subjacente, como fazemos aqui. Propriedades teóricas de uma série temporal com um modelo MA (1) Observe que o único valor não nulo na ACF teórica é para o atraso 1. Todas as outras autocorrelações são 0. Assim, uma ACF de amostra com uma autocorrelação significativa apenas no intervalo 1 é um indicador de um possível modelo MA (1). Para os estudantes interessados, provas destas propriedades são um apêndice a este folheto. Exemplo 1 Suponha que um modelo MA (1) seja x t 10 w t .7 w t-1. Onde (wt overset N (0,1)). Assim, o coeficiente 1 0,7. O ACF teórico é dado por Um gráfico deste ACF segue. O gráfico apenas mostrado é o ACF teórico para um MA (1) com 1 0,7. Na prática, uma amostra normalmente não proporciona um padrão tão claro. Usando R, simulamos n 100 valores de amostra usando o modelo x t 10 w t .7 w t-1 onde w t iid N (0,1). Para esta simulação, segue-se um gráfico de séries temporais dos dados da amostra. Não podemos dizer muito desse enredo. A ACF de amostra para os dados simulados segue. Observa-se que a amostra ACF não corresponde ao padrão teórico do MA subjacente (1), ou seja, que todas as autocorrelações para os atrasos de 1 serão 0 Uma amostra diferente teria uma ACF de amostra ligeiramente diferente mostrada abaixo, mas provavelmente teria as mesmas características gerais. Propriedades teóricas de uma série temporal com um modelo MA (2) Para o modelo MA (2), as propriedades teóricas são as seguintes: Note que os únicos valores não nulos na ACF teórica são para os retornos 1 e 2. As autocorrelações para atrasos maiores são 0 . Assim, uma ACF de amostra com autocorrelações significativas nos intervalos 1 e 2, mas autocorrelações não significativas para atrasos maiores indica um possível modelo MA (2). Iid N (0,1). Os coeficientes são 1 0,5 e 2 0,3. Como este é um MA (2), o ACF teórico terá valores não nulos apenas nos intervalos 1 e 2. Valores das duas autocorrelações não nulas são Um gráfico do ACF teórico segue. Como quase sempre é o caso, dados de exemplo não vai se comportar tão perfeitamente como a teoria. Foram simulados n 150 valores de amostra para o modelo x t 10 w t .5 w t-1 .3 w t-2. Onde w t iid N (0,1). O gráfico da série de tempo dos dados segue. Como com o gráfico de série de tempo para os dados de amostra de MA (1), você não pode dizer muito dele. A ACF de amostra para os dados simulados segue. O padrão é típico para situações em que um modelo MA (2) pode ser útil. Existem dois picos estatisticamente significativos nos intervalos 1 e 2, seguidos por valores não significativos para outros desfasamentos. Note que devido ao erro de amostragem, o ACF de amostra não corresponde exactamente ao padrão teórico. ACF para modelos MA (q) gerais Uma propriedade dos modelos MA (q) em geral é que existem autocorrelações não nulas para os primeiros q lags e autocorrelações 0 para todos os retornos gt q. Não-unicidade de conexão entre os valores de 1 e (rho1) no modelo MA (1). No modelo MA (1), para qualquer valor de 1. O 1/1 recíproco dá o mesmo valor para Como exemplo, use 0,5 para 1. E então use 1 / (0,5) 2 para 1. Você obterá (rho1) 0,4 em ambas as instâncias. Para satisfazer uma restrição teórica chamada invertibilidade. Nós restringimos os modelos MA (1) para ter valores com valor absoluto menor que 1. No exemplo dado, 1 0,5 será um valor de parâmetro permitido, enquanto que 1 1 / 0,5 2 não. Invertibilidade de modelos MA Um modelo MA é dito ser inversível se for algébrica equivalente a um modelo de ordem infinita convergente. Por convergência, queremos dizer que os coeficientes de AR diminuem para 0 à medida que avançamos no tempo. Invertibilidade é uma restrição programada em séries temporais de software utilizado para estimar os coeficientes de modelos com MA termos. Não é algo que verificamos na análise de dados. Informações adicionais sobre a restrição de invertibilidade para modelos MA (1) são fornecidas no apêndice. Teoria Avançada Nota. Para um modelo MA (q) com um ACF especificado, existe apenas um modelo invertible. A condição necessária para a invertibilidade é que os coeficientes têm valores tais que a equação 1- 1 y-. - q y q 0 tem soluções para y que caem fora do círculo unitário. Código R para os Exemplos No Exemplo 1, traçamos o ACF teórico do modelo x t 10w t. 7w t-1. E depois simularam n 150 valores deste modelo e traçaram a série temporal da amostra e a ACF da amostra para os dados simulados. Os comandos R utilizados para traçar o ACF teórico foram: acfma1ARMAacf (mac (0,7), lag. max10) 10 atrasos de ACF para MA (1) com theta1 0,7 lags0: 10 cria uma variável chamada atrasos que varia de 0 a 10. trama (Hg) adiciona um eixo horizontal ao gráfico O primeiro comando determina o ACF e o armazena em um objeto (a0) Chamado acfma1 (nossa escolha de nome). O comando de plotagem (o terceiro comando) traça defasagens em relação aos valores de ACF para os retornos 1 a 10. O parâmetro ylab rotula o eixo y eo parâmetro principal coloca um título no gráfico. Para ver os valores numéricos do ACF basta usar o comando acfma1. A simulação e as parcelas foram feitas com os seguintes comandos. Xcarima. sim (n150, lista (mac (0.7))) Simula n 150 valores de MA (1) xxc10 adiciona 10 para fazer média 10. Padrão de simulação significa 0. plot (x, typeb, mainSimulated MA (1) dados) Acf (x, xlimc (1,10), mainACF para dados de amostras simulados) No Exemplo 2, traçamos o ACF teórico do modelo xt 10 wt. 5 w t-1 .3 w t-2. E depois simularam n 150 valores deste modelo e traçaram a série temporal da amostra e a ACF da amostra para os dados simulados. Os comandos R utilizados foram acfma2ARMAacf (mac (0,5,0,3), lag. max10) acfma2 lags0: 10 parcela (atrasos, acfma2, xlimc (1,10), ylabr, tipoh, ACF principal para MA (2) com theta1 0,5, (X, typeb, principal série MA (2) simulada) acf (x, xlimc (1,10), x2) MainACF para dados simulados de MA (2) Apêndice: Prova de Propriedades de MA (1) Para estudantes interessados, aqui estão as provas para propriedades teóricas do modelo MA (1). Quando h 1, a expressão anterior 1 w 2. Para qualquer h 2, a expressão anterior 0 (x) é a expressão anterior x (x) A razão é que, por definição de independência do wt. E (w k w j) 0 para qualquer k j. Além disso, porque w t tem média 0, E (w j w j) E (w j 2) w 2. Para uma série de tempo, aplique este resultado para obter o ACF fornecido acima. Um modelo inversível MA é aquele que pode ser escrito como um modelo de ordem infinita AR que converge para que os coeficientes AR convergem para 0 como nos movemos infinitamente no tempo. Bem demonstrar invertibilidade para o modelo MA (1). Em seguida, substituimos a relação (2) para wt-1 na equação (1) (3) (zt wt theta1 (z-theta1w) wt theta1z-theta2w) No tempo t-2. A equação (2) torna-se Então substituimos a relação (4) para wt-2 na equação (3) (zt wt theta1 z - theta21w wt theta1z - theta21 (z - theta1w) wt theta1z-theta12z theta31w) Se continuássemos Infinitamente), obteríamos o modelo AR de ordem infinita (zt wt theta1 z - theta21z theta31z - theta41z dots) Observe, no entanto, que se 1 1, os coeficientes multiplicando os desfasamentos de z aumentarão (infinitamente) Tempo. Para evitar isso, precisamos de 1 lt1. Esta é a condição para um modelo MA (1) invertido. Infinite Order MA model Na semana 3, bem ver que um modelo AR (1) pode ser convertido em um modelo de ordem infinita MA: (xt - mu wt phi1w phi21w pontos phik1 w dots sum phij1w) Esta soma de termos de ruído branco passado é conhecido Como a representação causal de um AR (1). Em outras palavras, x t é um tipo especial de MA com um número infinito de termos remontando no tempo. Isso é chamado de ordem infinita MA ou MA (). Uma ordem finita MA é uma ordem infinita AR e qualquer ordem finita AR é uma ordem infinita MA. Lembre-se na Semana 1, observamos que uma exigência para um AR estacionário (1) é que 1 lt1. Vamos calcular o Var (x t) usando a representação causal. Esta última etapa usa um fato básico sobre séries geométricas que requer (phi1lt1) caso contrário, a série diverge. Navegação
Comments
Post a Comment