Tuesday 12 December 2017

Moving average ols


Média em Movimento - MA BREAKING DOWN Média de Mudança - MA Como exemplo de SMA, considere uma segurança com os seguintes preços de fechamento em 15 dias: Semana 1 (5 dias) 20, 22, 24, 25, 23 Semana 2 (5 dias) 26, 28, 26, 29, 27 semanas 3 (5 dias) 28, 30, 27, 29, 28 Um MA de 10 dias seria a média dos preços de fechamento dos primeiros 10 dias como primeiro ponto de dados. O próximo ponto de dados eliminaria o preço mais antigo, adicionaria o preço no dia 11 e levaria a média, e assim por diante, como mostrado abaixo. Conforme observado anteriormente, as MAs desaceleram a ação de preço atual porque são baseadas em preços passados ​​quanto mais o período de tempo para o MA, maior o atraso. Assim, um MA de 200 dias terá um grau de atraso muito maior do que um MA de 20 dias porque contém preços nos últimos 200 dias. O comprimento do MA a ser usado depende dos objetivos de negociação, com MAs mais curtos usados ​​para negociação de curto prazo e MA mais longo prazo mais adequados para investidores de longo prazo. O MA de 200 dias é amplamente seguido por investidores e comerciantes, com pausas acima e abaixo dessa média móvel considerada como sinais comerciais importantes. Os MAs também oferecem sinais comerciais importantes por conta própria, ou quando duas médias atravessam. Um MA ascendente indica que a segurança está em uma tendência de alta. Enquanto um MA decrescente indica que está em uma tendência de baixa. Da mesma forma, o momento ascendente é confirmado com um cruzamento de alta. Que ocorre quando um mes de curto prazo cruza acima de um MA de longo prazo. O impulso descendente é confirmado com um cruzamento de baixa, que ocorre quando um MA de curto prazo se cruza abaixo de MA. Moving médio e modelos de suavização exponencial. Como primeiro passo para mover além de modelos médios, modelos de caminhada aleatórios e modelos de tendência linear, Padrões e tendências não sazonais podem ser extrapolados usando um modelo de média móvel ou suavização. O pressuposto básico por trás da média e dos modelos de suavização é que as séries temporais são localmente estacionárias com uma média que varia lentamente. Por isso, tomamos uma média móvel (local) para estimar o valor atual da média e, em seguida, use isso como a previsão para um futuro próximo. Isso pode ser considerado como um compromisso entre o modelo médio e o modelo random-walk-without-drift. A mesma estratégia pode ser usada para estimar e extrapolar uma tendência local. Uma média móvel geralmente é chamada de uma versão quotsmoothedquot da série original porque a média a curto prazo tem o efeito de suavizar os solavancos na série original. Ao ajustar o grau de alisamento (a largura da média móvel), podemos esperar encontrar algum tipo de equilíbrio ideal entre o desempenho dos modelos de caminhada aleatória e média. O tipo mais simples de modelo de média é o. Média Móvel simples (igualmente ponderada): A previsão para o valor de Y no tempo t1 que é feita no tempo t é igual à média simples das observações m mais recentes: (Aqui e em outro lugar usarei o símbolo 8220Y-hat8221 para repousar Para uma previsão das séries temporais Y feitas o mais cedo possível por um determinado modelo.) Esta média é centrada no período t (m1) 2, o que implica que a estimativa da média local tende a ficar para trás do verdadeiro Valor da média local em cerca de (m1) 2 períodos. Assim, dizemos que a idade média dos dados na média móvel simples é (m1) 2 em relação ao período para o qual a previsão é calculada: esta é a quantidade de tempo pelo qual as previsões tenderão a atrasar os pontos de viragem nos dados . Por exemplo, se você estiver calculando a média dos últimos 5 valores, as previsões serão cerca de 3 períodos atrasados ​​na resposta a pontos de viragem. Observe que se m1, o modelo de média móvel simples (SMA) é equivalente ao modelo de caminhada aleatória (sem crescimento). Se m for muito grande (comparável ao comprimento do período de estimativa), o modelo SMA é equivalente ao modelo médio. Tal como acontece com qualquer parâmetro de um modelo de previsão, é costume ajustar o valor de k para obter o melhor quotfitquot para os dados, ou seja, os menores erros de previsão em média. Aqui é um exemplo de uma série que parece exibir flutuações aleatórias em torno de uma média que varia lentamente. Primeiro, vamos tentar ajustá-lo com um modelo de caminhada aleatória, o que equivale a uma média móvel simples de 1 termo: o modelo de caminhada aleatória responde muito rapidamente às mudanças na série, mas ao fazê-lo, elege muito da quotnoisequot no Dados (as flutuações aleatórias), bem como o quotsignalquot (a média local). Se, em vez disso, tentemos uma média móvel simples de 5 termos, obtemos um conjunto de previsões mais lisas: a média móvel simples de 5 meses produz erros significativamente menores do que o modelo de caminhada aleatória neste caso. A idade média dos dados nesta previsão é de 3 ((51) 2), de modo que tende a atrasar os pontos de viragem em cerca de três períodos. (Por exemplo, uma desaceleração parece ter ocorrido no período 21, mas as previsões não se desviam até vários períodos depois). Observe que as previsões de longo prazo do modelo SMA são uma linha reta horizontal, assim como na caminhada aleatória modelo. Assim, o modelo SMA assume que não há tendência nos dados. No entanto, enquanto as previsões do modelo de caminhada aleatória são simplesmente iguais ao último valor observado, as previsões do modelo SMA são iguais a uma média ponderada de valores recentes. Os limites de confiança calculados pela Statgraphics para as previsões de longo prazo da média móvel simples não se ampliam à medida que o horizonte de previsão aumenta. Isso obviamente não está correto. Infelizmente, não existe uma teoria estatística subjacente que nos diga como os intervalos de confiança devem se ampliar para esse modelo. No entanto, não é muito difícil calcular estimativas empíricas dos limites de confiança para as previsões do horizonte mais longo. Por exemplo, você poderia configurar uma planilha em que o modelo SMA seria usado para prever 2 passos à frente, 3 passos à frente, etc., dentro da amostra de dados históricos. Você poderia então calcular os desvios padrão da amostra dos erros em cada horizonte de previsão e, em seguida, construir intervalos de confiança para previsões de longo prazo, adicionando e subtraindo múltiplos do desvio padrão apropriado. Se tentarmos uma média móvel simples de 9 termos, obtemos previsões ainda mais suaves e mais de um efeito de atraso: a idade média é agora de 5 períodos (91) 2). Se tomarmos uma média móvel de 19 termos, a média de idade aumenta para 10: Observe que, de fato, as previsões estão atrasadas em torno de 10 pontos. Qual quantidade de suavização é melhor para esta série. Aqui está uma tabela que compara suas estatísticas de erro, incluindo também uma média de 3 termos: Modelo C, a média móvel de 5 termos, produz o menor valor de RMSE por uma pequena margem ao longo dos 3 Médias temporais e de 9 termos, e suas outras estatísticas são quase idênticas. Assim, entre os modelos com estatísticas de erro muito semelhantes, podemos escolher se preferimos um pouco mais de capacidade de resposta ou um pouco mais de suavidade nas previsões. (Retornar ao topo da página.) Browns Suavização exponencial simples (média móvel ponderada exponencialmente) O modelo de média móvel simples descrito acima tem a propriedade indesejável de que trata as últimas observações k de forma igualitária e ignora completamente todas as observações precedentes. Intuitivamente, os dados passados ​​devem ser descontados de forma mais gradual - por exemplo, a observação mais recente deve ter um pouco mais de peso que o segundo mais recente, e o segundo mais recente deve ter um pouco mais de peso do que o terceiro mais recente, e em breve. O modelo de suavização exponencial simples (SES) realiza isso. Deixe 945 indicar uma constante de quotesmoothing (um número entre 0 e 1). Uma maneira de escrever o modelo é definir uma série L que represente o nível atual (isto é, o valor médio local) da série como estimado a partir de dados até o presente. O valor de L no tempo t é calculado de forma recursiva a partir de seu próprio valor anterior como este: Assim, o valor suavizado atual é uma interpolação entre o valor suavizado anterior e a observação atual, onde 945 controla a proximidade do valor interpolado para o mais recente observação. A previsão para o próximo período é simplesmente o valor suavizado atual: Equivalentemente, podemos expressar a próxima previsão diretamente em termos de previsões anteriores e observações anteriores, em qualquer uma das seguintes versões equivalentes. Na primeira versão, a previsão é uma interpolação entre previsão anterior e observação anterior: na segunda versão, a próxima previsão é obtida ajustando a previsão anterior na direção do erro anterior em uma quantidade fracionada de 945. É o erro cometido em Tempo t. Na terceira versão, a previsão é uma média móvel ponderada exponencialmente (com desconto) com o fator de desconto 1- 945: a versão de interpolação da fórmula de previsão é a mais simples de usar se você estiver implementando o modelo em uma planilha: ela se encaixa em uma Célula única e contém referências de células que apontam para a previsão anterior, a observação anterior e a célula onde o valor de 945 é armazenado. Note-se que se 945 1, o modelo SES é equivalente a um modelo de caminhada aleatória (sem crescimento). Se 945 0, o modelo SES é equivalente ao modelo médio, supondo que o primeiro valor suavizado seja igual à média. (Voltar ao topo da página.) A idade média dos dados na previsão de suavização simples-exponencial é 1 945 em relação ao período para o qual a previsão é calculada. (Isso não deve ser óbvio, mas pode ser facilmente demonstrado pela avaliação de uma série infinita.) Portanto, a previsão média móvel simples tende a atrasar os pontos de viragem em cerca de 1 945 períodos. Por exemplo, quando 945 0.5 o atraso é de 2 períodos quando 945 0.2 o atraso é de 5 períodos quando 945 0.1 o atraso é de 10 períodos e assim por diante. Para uma média de idade dada (ou seja, a quantidade de lag), a previsão de suavização exponencial simples (SES) é um pouco superior à previsão da média móvel simples (SMA) porque coloca um peso relativamente maior na observação mais recente - isto é. É um pouco mais quotresponsivech para as mudanças ocorridas no passado recente. Por exemplo, um modelo SMA com 9 termos e um modelo SES com 945 0,2 ambos têm uma idade média de 5 para os dados em suas previsões, mas o modelo SES coloca mais peso nos últimos 3 valores do que o modelo SMA e no Ao mesmo tempo, não possui 8220forget8221 sobre valores com mais de 9 períodos de tempo, como mostrado neste gráfico: Outra vantagem importante do modelo SES sobre o modelo SMA é que o modelo SES usa um parâmetro de suavização que é continuamente variável, portanto, pode otimizar facilmente Usando um algoritmo quotsolverquot para minimizar o erro quadrático médio. O valor ideal de 945 no modelo SES para esta série é 0.2961, como mostrado aqui: A idade média dos dados nesta previsão é 10.2961 3,4 períodos, o que é semelhante ao de uma média móvel simples de 6 termos. As previsões de longo prazo do modelo SES são uma linha direta horizontal. Como no modelo SMA e no modelo de caminhada aleatória sem crescimento. No entanto, note que os intervalos de confiança computados por Statgraphics agora divergem de forma razoável e que eles são substancialmente mais estreitos do que os intervalos de confiança para o modelo de caminhada aleatória. O modelo SES assume que a série é um pouco mais previsível do que o modelo de caminhada aleatória. Um modelo SES é realmente um caso especial de um modelo ARIMA. Então a teoria estatística dos modelos ARIMA fornece uma base sólida para o cálculo de intervalos de confiança para o modelo SES. Em particular, um modelo SES é um modelo ARIMA com uma diferença não-sazonal, um termo MA (1) e nenhum termo constante. Também conhecido como um modelo quotARIMA (0,1,1) sem constantequot. O coeficiente MA (1) no modelo ARIMA corresponde à quantidade 1- 945 no modelo SES. Por exemplo, se você ajustar um modelo ARIMA (0,1,1) sem constante para a série analisada aqui, o coeficiente MA (1) estimado é 0.7029, o que é quase exatamente um menos 0.2961. É possível adicionar a hipótese de uma tendência linear constante não-zero ao modelo SES. Para fazer isso, basta especificar um modelo ARIMA com uma diferença não-sazonal e um termo MA (1) com uma constante, ou seja, um modelo ARIMA (0,1,1) com constante. As previsões a longo prazo terão uma tendência que é igual à tendência média observada durante todo o período de estimação. Você não pode fazer isso em conjunto com o ajuste sazonal, porque as opções de ajuste sazonal são desativadas quando o tipo de modelo é definido como ARIMA. No entanto, você pode adicionar uma tendência exponencial constante a longo prazo a um modelo de suavização exponencial simples (com ou sem ajuste sazonal) usando a opção de ajuste de inflação no procedimento de Previsão. A taxa de quotinflação adequada (taxa de crescimento) por período pode ser estimada como o coeficiente de inclinação em um modelo de tendência linear ajustado aos dados em conjunto com uma transformação de logaritmo natural, ou pode ser baseado em outras informações independentes sobre perspectivas de crescimento a longo prazo . (Voltar ao topo da página.) Browns Linear (ou seja, duplo) Suavização exponencial Os modelos SMA e os modelos SES assumem que não há nenhuma tendência de nenhum tipo nos dados (o que normalmente é OK ou pelo menos não muito ruim para 1- Previsões passo a passo quando os dados são relativamente barulhentos) e podem ser modificados para incorporar uma tendência linear constante como mostrado acima. E quanto a tendências de curto prazo Se uma série exibir uma taxa de crescimento variável ou um padrão cíclico que se destaca claramente contra o ruído e, se houver necessidade de prever mais de 1 período à frente, a estimativa de uma tendência local também pode ser um problema. O modelo de alisamento exponencial simples pode ser generalizado para obter um modelo de alisamento exponencial linear (LES) que calcula estimativas locais de nível e tendência. O modelo de tendência mais simples do tempo é o modelo de suavização exponencial linear Browns, que usa duas séries suavizadas diferentes centradas em diferentes pontos no tempo. A fórmula de previsão é baseada em uma extrapolação de uma linha através dos dois centros. (Uma versão mais sofisticada deste modelo, Holt8217s, é discutida abaixo.) A forma algébrica do modelo de alisamento exponencial linear Brown8217s, como a do modelo de suavização exponencial simples, pode ser expressa em várias formas diferentes, mas equivalentes. A forma quotstandardquot deste modelo geralmente é expressa da seguinte maneira: Seja S denotar a série de suavização individual obtida pela aplicação de suavização exponencial simples para a série Y. Ou seja, o valor de S no período t é dado por: (Lembre-se que, sob simples Suavização exponencial, esta seria a previsão de Y no período t1.) Então, deixe Squot indicar a série duplamente suavizada obtida aplicando o alisamento exponencial simples (usando o mesmo 945) para a série S: Finalmente, a previsão para Y tk. Para qualquer kgt1, é dada por: Isto produz e 1 0 (isto é, traga um pouco e deixe a primeira previsão igual a primeira observação real) e e 2 Y 2 8211 Y 1. Após o que as previsões são geradas usando a equação acima. Isso produz os mesmos valores ajustados que a fórmula com base em S e S, se estes últimos foram iniciados usando S 1 S 1 Y 1. Esta versão do modelo é usada na próxima página que ilustra uma combinação de suavização exponencial com ajuste sazonal. Holt8217s Linear Exponential Suavizante Brown8217s modelo LES calcula estimativas locais de nível e tendência ao suavizar os dados recentes, mas o fato de que ele faz com um único parâmetro de suavização coloca uma restrição nos padrões de dados que ele pode caber: o nível e a tendência Não podem variar a taxas independentes. O modelo LES de Holt8217s aborda esse problema ao incluir duas constantes de suavização, uma para o nível e outra para a tendência. A qualquer momento t, como no modelo Brown8217s, existe uma estimativa L t do nível local e uma estimativa T t da tendência local. Aqui, eles são computados de forma recursiva a partir do valor de Y observado no tempo t e as estimativas anteriores do nível e tendência por duas equações que aplicam o alisamento exponencial separadamente. Se o nível estimado e a tendência no tempo t-1 são L t82091 e T t-1. Respectivamente, então a previsão de Y tshy que teria sido feita no tempo t-1 é igual a L t-1 T t-1. Quando o valor real é observado, a estimativa atualizada do nível é calculada de forma recursiva interpolando entre Y tshy e sua previsão, L t-1 T t-1, usando pesos de 945 e 1- 945. A alteração no nível estimado, Lt 8209 L t82091. Pode ser interpretado como uma medida ruim da tendência no tempo t. A estimativa atualizada da tendência é então calculada de forma recursiva interpolando entre L t 8209 L t82091 e a estimativa anterior da tendência, T t-1. Usando pesos de 946 e 1-946: a interpretação da constante de simulação de tendência 946 é análoga à da constante de alívio de nível 945. Modelos com valores pequenos de 946 assumem que a tendência muda muito lentamente ao longo do tempo, enquanto modelos com 946 maiores assumem que está mudando mais rapidamente. Um modelo com um grande 946 acredita que o futuro distante é muito incerto, porque os erros na estimativa de tendência se tornam bastante importantes ao prever mais de um período à frente. (Voltar ao topo da página.) As constantes de suavização 945 e 946 podem ser estimadas da maneira usual, minimizando o erro quadrático médio das previsões de 1 passo à frente. Quando isso é feito em Statgraphics, as estimativas revelam-se 945 0,3048 e 946 0,008. O valor muito pequeno de 946 significa que o modelo assume mudanças muito pequenas na tendência de um período para o outro, então, basicamente, esse modelo está tentando estimar uma tendência de longo prazo. Por analogia com a noção de idade média dos dados utilizados na estimativa do nível local da série, a idade média dos dados utilizados na estimativa da tendência local é proporcional a 1 946, embora não exatamente igual a ela. . Neste caso, isso é 10.006 125. Este não é um número muito preciso na medida em que a precisão da estimativa de 946 não é realmente 3 casas decimais, mas é da mesma ordem geral de grandeza que o tamanho da amostra de 100, então Este modelo está com uma média de bastante história na estimativa da tendência. O gráfico de previsão abaixo mostra que o modelo de LES estima uma tendência local um pouco maior no final da série do que a tendência constante estimada no modelo SEStrend. Além disso, o valor estimado de 945 é quase idêntico ao obtido pela montagem do modelo SES com ou sem tendência, então este é quase o mesmo modelo. Agora, isso parece previsões razoáveis ​​para um modelo que deveria estimar uma tendência local Se você 8220eyeball8221 este gráfico, parece que a tendência local virou para baixo no final da série O que aconteceu Os parâmetros deste modelo Foi estimado pela minimização do erro quadrado das previsões de 1 passo à frente, não de previsões a mais longo prazo, caso em que a tendência não faz muita diferença. Se tudo o que você está procurando é erros de 1 passo a passo, você não está vendo a imagem maior das tendências em relação a (digamos) 10 ou 20 períodos. Para obter este modelo mais em sintonia com a extrapolação dos dados no olho, podemos ajustar manualmente a constante de alívio da tendência, de modo que ele use uma linha de base mais curta para a estimativa de tendência. Por exemplo, se optar por definir 946 0,1, a idade média dos dados utilizados na estimativa da tendência local é de 10 períodos, o que significa que estamos em média a tendência nos últimos 20 períodos ou mais. Aqui é o que parece o gráfico de previsão se definimos 946 0,1 enquanto mantemos 945 0,3. Isso parece intuitivamente razoável para esta série, embora seja provavelmente perigoso extrapolar esta tendência mais de 10 períodos no futuro. E as estatísticas de erro Aqui está uma comparação de modelo para os dois modelos mostrados acima, bem como três modelos SES. O valor ideal de 945 para o modelo SES é de aproximadamente 0,3, mas resultados semelhantes (com um pouco mais ou menos capacidade de resposta, respectivamente) são obtidos com 0,5 e 0,2. (A) Holts linear exp. Alisamento com alpha 0.3048 e beta 0.008 (B) Holts linear exp. Alisamento com alfa 0.3 e beta 0.1 (C) Suavização exponencial simples com alfa 0.5 (D) Suavização exponencial simples com alfa 0.3 (E) Suavização exponencial simples com alfa 0.2 Suas estatísticas são quase idênticas, então realmente podemos usar a escolha com base De erros de previsão de 1 passo à frente na amostra de dados. Temos de voltar atrás em outras considerações. Se acreditamos firmemente que faz sentido basear a estimativa da tendência atual sobre o que aconteceu nos últimos 20 períodos, podemos fazer um caso para o modelo LES com 945 0,3 e 946 0,1. Se quisermos ser agnósticos sobre se existe uma tendência local, então um dos modelos SES pode ser mais fácil de explicar e também daria mais previsões do meio da estrada para os próximos 5 ou 10 períodos. (Retornar ao topo da página.) Qual tipo de tendência-extrapolação é melhor: horizontal ou linear Evidências empíricas sugerem que, se os dados já foram ajustados (se necessário) para inflação, então pode ser imprudente extrapolar linear de curto prazo Tendências muito distantes no futuro. As tendências evidentes hoje podem diminuir no futuro devido a causas variadas, como obsolescência do produto, aumento da concorrência e recessões cíclicas ou aumentos em uma indústria. Por este motivo, o alisamento exponencial simples geralmente apresenta melhor fora da amostra do que seria de esperar, apesar da sua extrapolação de tendência horizontal de quotnaivequot. As modificações de tendências amortecidas do modelo de alisamento exponencial linear também são freqüentemente usadas na prática para introduzir uma nota de conservadorismo em suas projeções de tendência. O modelo LES da modificação amortecida pode ser implementado como um caso especial de um modelo ARIMA, em particular, um modelo ARIMA (1,1,2). É possível calcular intervalos de confiança em torno de previsões de longo prazo produzidas por modelos exponenciais de suavização, considerando-os como casos especiais de modelos ARIMA. (Beware: nem todo o software calcula os intervalos de confiança para esses modelos corretamente.) A largura dos intervalos de confiança depende de (i) o erro RMS do modelo, (ii) o tipo de alisamento (simples ou linear) (iii) o valor (S) da (s) constante (s) de suavização e (iv) o número de períodos adiante que você está prevendo. Em geral, os intervalos se espalham mais rápido, à medida que 945 se ampliam no modelo SES e se espalham muito mais rápido quando o alisamento linear, em vez do simples, é usado. Este tópico é discutido mais adiante na seção de modelos ARIMA das notas. (Retornar ao topo da página.) Os processos de erro em média móvel (erros ARMA) autoregressivos e outros modelos que envolvem atrasos de erros podem ser estimados usando instruções FIT e simuladas ou previstas usando instruções SOLVE. Os modelos ARMA para o processo de erro são freqüentemente usados ​​para modelos com resíduos auto-correlacionados. A macro AR pode ser usada para especificar modelos com processos de erro auto - gressivo. A macro MA pode ser usada para especificar modelos com processos de erro em média móvel. Erros Autoregressivos Um modelo com erros autoregressivos de primeira ordem, AR (1), tem a forma enquanto um processo de erro AR (2) tem a forma e assim por diante para processos de ordem superior. Note-se que os s são independentes e distribuídos de forma idêntica e têm um valor esperado de 0. Um exemplo de um modelo com um componente AR (2) é e assim por diante para processos de ordem superior. Por exemplo, você pode escrever um modelo de regressão linear simples com MA (2) erros de média móvel como onde MA1 e MA2 são os parâmetros de média móvel. Observe que RESID. Y é definido automaticamente pelo PROC MODELE, pois a função ZLAG deve ser usada para modelos MA para truncar a recursão dos atrasos. Isso garante que os erros atrasados ​​começam em zero na fase de inicialização e não propagam os valores faltantes quando as variáveis ​​do período de inicialização faltam, e garante que os erros futuros sejam zero, em vez de perder durante a simulação ou a previsão. Para obter detalhes sobre as funções de atraso, consulte a seção Lag Logic. Este modelo escrito usando a macro MA é o seguinte: Formulário geral para modelos ARMA O processo geral ARMA (p, q) tem a seguinte forma Um modelo ARMA (p, q) pode ser especificado da seguinte forma: onde AR i e MA j representam Os parâmetros da média autorregressiva e móvel para os vários atrasos. Você pode usar qualquer nome que você deseja para essas variáveis, e há muitas maneiras equivalentes de que a especificação possa ser escrita. Os processos ARMA do vetor também podem ser estimados com PROC MODELO. Por exemplo, um processo AR (1) de duas variáveis ​​para os erros das duas variáveis ​​endógenas Y1 e Y2 pode ser especificado da seguinte forma: Problemas de convergência com modelos ARMA Os modelos ARMA podem ser difíceis de estimar. Se as estimativas dos parâmetros não estiverem dentro do intervalo apropriado, os termos residuais dos modelos de média móvel crescem exponencialmente. Os resíduos calculados para observações posteriores podem ser muito grandes ou podem transbordar. Isso pode acontecer porque os valores iniciais inadequados foram usados ​​ou porque as iterações se afastaram de valores razoáveis. O cuidado deve ser usado na escolha dos valores iniciais para os parâmetros ARMA. Os valores iniciais de 0,001 para parâmetros ARMA geralmente funcionam se o modelo se adequar bem aos dados e o problema está bem condicionado. Note-se que um modelo de MA pode ser frequentemente aproximado por um modelo AR de alta ordem e vice-versa. Isso pode resultar em colinearidade elevada em modelos mistos de ARMA, o que, por sua vez, pode causar graves condicionamentos nos cálculos e instabilidade das estimativas dos parâmetros. Se você tiver problemas de convergência ao estimar um modelo com processos de erro ARMA, tente estimar em etapas. Primeiro, use uma instrução FIT para estimar apenas os parâmetros estruturais com os parâmetros ARMA mantidos em zero (ou para estimativas anteriores razoáveis ​​se disponíveis). Em seguida, use outra instrução FIT para estimar somente os parâmetros ARMA, usando os valores dos parâmetros estruturais da primeira execução. Uma vez que os valores dos parâmetros estruturais provavelmente estarão próximos de suas estimativas finais, as estimativas dos parâmetros ARMA podem agora convergir. Finalmente, use outra declaração FIT para produzir estimativas simultâneas de todos os parâmetros. Uma vez que os valores iniciais dos parâmetros agora são provavelmente muito próximos das suas estimativas conjuntas finais, as estimativas devem convergir rapidamente se o modelo for apropriado para os dados. AR Condições iniciais Os atrasos iniciais dos termos de erro dos modelos AR (p) podem ser modelados de diferentes maneiras. Os métodos de inicialização de erros autorregressivos suportados pelos procedimentos SASETS são os seguintes: mínimos quadrados condicionais (procedimentos ARIMA e MODELO) mínimos quadrados incondicionais (procedimentos AUTOREG, ARIMA e MODELO) probabilidade máxima (procedimentos AUTOREG, ARIMA e MODELO) Yule-Walker (AUTOREG Somente procedimento) Hildreth-Lu, que exclui as primeiras observações p (somente procedimento MODEL) Consulte o Capítulo 8, Procedimento AUTOREG, para uma explicação e discussão dos méritos de vários métodos de inicialização AR (p). As iniciações CLS, ULS, ML e HL podem ser realizadas pelo PROC MODELO. Para erros AR (1), essas iniciais podem ser produzidas como mostrado na Tabela 18.2. Esses métodos são equivalentes em grandes amostras. Tabela 18.2 Inicializações realizadas pelo PROC MODELO: AR (1) ERROS Os atrasos iniciais dos termos de erro dos modelos MA (q) também podem ser modelados de maneiras diferentes. Os procedimentos de ARIMA e MODELO seguintes são suportados pelos seguintes procedimentos: mínimos quadrados incondicionais, mínimos quadrados condicionais. O método dos mínimos quadrados condicionais para estimar os termos de erro em média móvel não é otimizado porque ignora o problema de inicialização. Isso reduz a eficiência das estimativas, embora permaneçam imparciais. Os resíduos remanescentes iniciais, que se estendem antes do início dos dados, são assumidos como 0, seu valor esperado incondicional. Isso introduz uma diferença entre esses resíduos e os resíduos de mínimos quadrados generalizados para a covariância média móvel, que, ao contrário do modelo autorregressivo, persiste através do conjunto de dados. Geralmente, essa diferença converge rapidamente para 0, mas para processos em média móveis quase não-reversíveis, a convergência é bastante lenta. Para minimizar este problema, você deve ter muitos dados e as estimativas dos parâmetros da média móvel devem estar bem dentro do intervalo inversível. Este problema pode ser corrigido à custa de escrever um programa mais complexo. As estimativas de mínimos quadrados incondicionais para o processo MA (1) podem ser produzidas especificando o modelo da seguinte maneira: os erros médios em movimento podem ser difíceis de estimar. Você deve considerar usar uma aproximação AR (p) ao processo de média móvel. Um processo de média móvel geralmente pode ser bem-aproximado por um processo autorregressivo se os dados não tiverem sido suavizados ou diferenciados. A AR Macro A macro macro SAS gera declarações de programação para PROC MODEL para modelos autoregressivos. A macro AR faz parte do software SASETS e nenhuma opção especial precisa ser configurada para usar a macro. O processo autorregressivo pode ser aplicado aos erros de equação estrutural ou às próprias séries endógenas. A macro AR pode ser usada para os seguintes tipos de autorregressão: autoregresão vetorial irrestrita Autoregresão vetorial restrita Autoriação Univariada Para modelar o termo de erro de uma equação como processo autoregressivo, use a seguinte declaração após a equação: Por exemplo, suponha que Y seja um Função linear de X1, X2 e um erro AR (2). Você escreveria este modelo da seguinte maneira: as chamadas para AR devem vir após todas as equações ao qual o processo se aplica. A invocação de macro anterior, AR (y, 2), produz as instruções mostradas na saída LIST na Figura 18.58. Figura 18.58 Saída da opção LIST para um modelo AR (2) As variáveis ​​prefixadas PRED são variáveis ​​de programa temporárias usadas para que os atrasos dos resíduos sejam os resíduos corretos e não os redefinidos por esta equação. Observe que isso é equivalente às declarações explicitamente escritas na seção Formulário geral para modelos ARMA. Você também pode restringir os parâmetros autorregressivos a zero em atrasos selecionados. Por exemplo, se você queria parâmetros autorregressivos nos intervalos 1, 12 e 13, você pode usar as seguintes instruções: Essas instruções geram a saída mostrada na Figura 18.59. Figura 18.59 Saída da opção LIST para um modelo AR com Lags em 1, 12 e 13 O MODELO Lista de Procedimentos da Declaração de Código do Programa Compilado como Pareded PRED. yab x1 c x2 RESID. y PRED. y - ACTUAL. y ERROR. y PRED. Y - y OLDPRED. y PRED. y yl1 ZLAG1 (y - perdy) yl12 ZLAG12 (y - perdy) yl13 ZLAG13 (y - perdy) RESID. y PRED. y - REAL. y ERROR. y PRED. y - y Existem Variações no método dos mínimos quadrados condicionais, dependendo se as observações no início da série são usadas para aquecer o processo AR. Por padrão, o método de mínimos quadrados condicionais de AR usa todas as observações e assume zeros para os atrasos iniciais de termos autorregressivos. Ao usar a opção M, você pode solicitar que o AR use o método de mínimos quadrados incondicionais (ULS) ou máximo (ML). Por exemplo, as discussões desses métodos são fornecidas na seção AR Condições iniciais. Ao usar a opção MCLS n, você pode solicitar que as primeiras n observações sejam usadas para calcular estimativas dos atrasos de autorregressão iniciais. Neste caso, a análise começa com a observação n 1. Por exemplo: Você pode usar a macro AR para aplicar um modelo auto - gressivo à variável endógena, em vez do termo de erro, usando a opção TYPEV. Por exemplo, se você quiser adicionar os últimos atrasos de Y para a equação no exemplo anterior, você poderia usar AR para gerar os parâmetros e atrasos usando as seguintes instruções: As instruções anteriores geram a saída mostrada na Figura 18.60. Figura 18.60 LIST Opção Saída para um modelo AR de Y Este modelo prediz Y como uma combinação linear de X1, X2, uma intercepção e os valores de Y nos cinco períodos mais recentes. Autoregression vetorial sem restrições Para modelar os termos de erro de um conjunto de equações como um processo auto-regressivo de vetor, use a seguinte forma da macro AR após as equações: O nome do nome do processo é qualquer nome que você fornece para que AR use na criação de nomes para o autorregressivo Parâmetros. Você pode usar a macro AR para modelar vários processos AR diferentes para diferentes conjuntos de equações usando diferentes nomes de processos para cada conjunto. O nome do processo garante que os nomes de variáveis ​​usados ​​sejam únicos. Use um valor curto do nome do processo para o processo se as estimativas dos parâmetros forem gravadas em um conjunto de dados de saída. A macro AR tenta construir nomes de parâmetros menores ou iguais a oito caracteres, mas isso é limitado pelo comprimento do nome do processo. Que é usado como um prefixo para os nomes dos parâmetros AR. O valor variablelist é a lista de variáveis ​​endógenas para as equações. Por exemplo, suponha que os erros das equações Y1, Y2 e Y3 sejam gerados por um processo auto-regressivo de vetor de segunda ordem. Você pode usar as seguintes instruções: que geram o seguinte para Y1 e código similar para Y2 e Y3: Somente o método de mínimos quadrados condicionais (MCLS ou MCLS n) pode ser usado para processos vetoriais. Você também pode usar o mesmo formulário com restrições que a matriz de coeficientes seja 0 em atrasos selecionados. Por exemplo, as seguintes afirmações aplicam um processo vetorial de terceira ordem aos erros de equação com todos os coeficientes no intervalo 2 restrito a 0 e com os coeficientes nos atrasos 1 e 3 sem restrições: você pode modelar as três séries Y1Y3 como um processo auto-regressivo vetorial Nas variáveis ​​em vez dos erros usando a opção TYPEV. Se você quer modelar Y1Y3 como uma função de valores passados ​​de Y1Y3 e algumas variáveis ​​ou constantes exógenas, você pode usar AR para gerar as declarações para os termos de atraso. Escreva uma equação para cada variável para a parte não autorregente do modelo e, em seguida, chame AR com a opção TYPEV. Por exemplo, a parte não autorregente do modelo pode ser uma função de variáveis ​​exógenas, ou pode ser parâmetros de interceptação. Se não existirem componentes exógenos para o modelo de autoregressão vetorial, incluindo sem interceptações, atribua zero a cada uma das variáveis. Deve haver uma atribuição para cada uma das variáveis ​​antes de chamar AR. Este exemplo modela o vetor Y (Y1 Y2 Y3) como uma função linear apenas do seu valor nos dois períodos anteriores e um vetor de erro de ruído branco. O modelo possui 18 (3 3 3 3) parâmetros. Sintaxe da AR Macro Existem dois casos da sintaxe da macro AR. Quando as restrições em um processo AR vetorial não são necessárias, a sintaxe da macro AR tem o formulário geral especifica um prefixo para AR para usar na construção de nomes de variáveis ​​necessárias para definir o processo AR. Se o endolista não for especificado, a lista endógena padrão nomeará. Que deve ser o nome da equação a que o processo de erro AR deve ser aplicado. O valor do nome não pode exceder 32 caracteres. É a ordem do processo AR. Especifica a lista de equações para as quais o processo AR deve ser aplicado. Se for dado mais de um nome, um processo vetorial irrestrito é criado com os resíduos estruturais de todas as equações incluídas como regressores em cada uma das equações. Se não for especificado, o endolista padrão nomeará. Especifica a lista de atrasos em que os termos AR devem ser adicionados. Os coeficientes dos termos em atrasos não listados são definidos como 0. Todos os atrasos listados devem ser inferiores ou iguais a nlag. E não deve haver duplicatas. Se não for especificado, o laglista é padrão para todos os atrasos 1 através de nlag. Especifica o método de estimação para implementar. Os valores válidos de M são CLS (estimativas de mínimos quadrados condicionais), ULS (estimativas de mínimos quadrados incondicionais) e ML (estimativas de máxima verossimilhança). O MCLS é o padrão. Somente o MCLS é permitido quando mais de uma equação é especificada. Os métodos ULS e ML não são suportados para modelos vetoriais AR por AR. Especifica que o processo AR deve ser aplicado às próprias variáveis ​​endógenas em vez de aos resíduos estruturais das equações. Autoregression vetorial restrita Você pode controlar quais parâmetros estão incluídos no processo, restringindo a 0 os parâmetros que você não inclui. Primeiro, use AR com a opção DEFER para declarar a lista de variáveis ​​e definir a dimensão do processo. Em seguida, use chamadas de AR adicionais para gerar termos para equações selecionadas com variáveis ​​selecionadas em atrasos selecionados. Por exemplo, as equações de erro produzidas são as seguintes: Este modelo afirma que os erros para Y1 dependem dos erros de Y1 e Y2 (mas não de Y3) nos dois intervalos 1 e 2 e que os erros para Y2 e Y3 dependem de Os erros anteriores para todas as três variáveis, mas apenas no intervalo 1. Sintaxe de macro AR para vetor vetorial restrito O uso alternativo de AR pode impor restrições sobre um processo de AR vetorial ao chamar AR várias vezes para especificar diferentes termos de AR e atrasos para diferentes Equações. A primeira chamada tem o formulário geral especifica um prefixo para AR para usar na construção de nomes de variáveis ​​necessárias para definir o processo do vetor AR. Especifica a ordem do processo AR. Especifica a lista de equações para as quais o processo AR deve ser aplicado. Especifica que AR não é para gerar o processo AR, mas é esperar por informações adicionais especificadas em chamadas AR mais recentes para o mesmo valor de nome. As chamadas subsequentes têm a forma geral é a mesma que na primeira chamada. Especifica a lista de equações às quais as especificações nesta chamada AR devem ser aplicadas. Somente os nomes especificados no valor endolista da primeira chamada para o valor do nome podem aparecer na lista de equações na eqlist. Especifica a lista de equações cujos resíduos estruturais atrasados ​​devem ser incluídos como regressores nas equações em eqlist. Somente nomes no endolista da primeira chamada para o valor do nome podem aparecer na varlist. Se não for especificado, varlist é padrão para endolista. Especifica a lista de atrasos em que os termos AR devem ser adicionados. Os coeficientes dos termos em atrasos não listados são definidos como 0. Todos os atrasos listados devem ser menores ou iguais ao valor de nlag. E não deve haver duplicatas. Se não for especificado, o laglist é padrão para todos os atrasos 1 até nlag. A MA Macro A macro macro SAS gera declarações de programação para PROC MODEL para modelos em média móveis. A macro MA é parte do software SASETS e nenhuma opção especial é necessária para usar a macro. O processo de erro em média móvel pode ser aplicado aos erros de equação estrutural. A sintaxe da macro MA é a mesma que a macro AR, exceto que não existe um argumento TYPE. Quando você está usando as macros MA e AR combinadas, a macro MA deve seguir a macro AR. As seguintes instruções SASIML produzem um processo de erro ARMA (1, (1 3)) e salve-o no conjunto de dados MADAT2. As seguintes instruções PROC MODEL são usadas para estimar os parâmetros deste modelo usando a estrutura de erro de máxima verossimilhança: as estimativas dos parâmetros produzidos por esta execução são mostradas na Figura 18.61. Figura 18.61 Estimativas de um ARMA (1, (1 3)) Processo Existem dois casos da sintaxe para a macro MA. Quando as restrições em um processo de vetor MA não são necessárias, a sintaxe da macro MA tem o formulário geral especifica um prefixo para MA para usar na construção de nomes de variáveis ​​necessárias para definir o processo MA e é o endolista padrão. É a ordem do processo de MA. Especifica as equações para as quais o processo MA deve ser aplicado. Se mais de um nome for dado, a estimativa de CLS é usada para o processo vetorial. Especifica os atrasos em que os termos MA devem ser adicionados. Todos os atrasos listados devem ser inferiores ou iguais a nlag. E não deve haver duplicatas. Se não for especificado, o laglista é padrão para todos os atrasos 1 através de nlag. Especifica o método de estimação para implementar. Os valores válidos de M são CLS (estimativas de mínimos quadrados condicionais), ULS (estimativas de mínimos quadrados incondicionais) e ML (estimativas de máxima verossimilhança). O MCLS é o padrão. Somente o MCLS é permitido quando mais de uma equação é especificada no endolista. Sintaxe de Macro MA para Média de Movimento de Vetor Restrito Um uso alternativo de MA é permitido para impor restrições em um processo de vetor de MA, chamando MA várias vezes para especificar diferentes termos e atrasos de MA para diferentes equações. A primeira chamada tem o formulário geral especifica um prefixo para MA para usar na construção de nomes de variáveis ​​necessárias para definir o processo de vetor MA. Especifica a ordem do processo MA. Especifica a lista de equações para as quais o processo MA deve ser aplicado. Especifica que MA não é para gerar o processo MA, mas é esperar por informações adicionais especificadas em chamadas MA mais recentes para o mesmo valor de nome. As chamadas subsequentes têm a forma geral é a mesma que na primeira chamada. Especifica a lista de equações a que as especificações nesta chamada MA devem ser aplicadas. Especifica a lista de equações cujos resíduos estruturais atrasados ​​devem ser incluídos como regressores nas equações em eqlist. Especifica a lista de atrasos em que os termos MA devem ser adicionados.

No comments:

Post a Comment