Sunday 22 October 2017

What is moving average forecasting


Moving Average Forecasting Introdução. Como você pode imaginar, estamos olhando para algumas das abordagens mais primitivas para a previsão. Mas espero que estas sejam pelo menos uma introdução interessante a algumas das questões de computação relacionadas à implementação de previsões em planilhas. Neste sentido, vamos continuar a partir do início e começar a trabalhar com previsões de média móvel. Previsões médias móveis. Todo mundo está familiarizado com as previsões de média móvel, independentemente de eles acreditam que são. Todos os estudantes universitários fazê-los o tempo todo. Pense nas suas pontuações dos testes num curso em que vai ter quatro testes durante o semestre. Vamos supor que você tem um 85 em seu primeiro teste. O que você poderia prever para sua pontuação do segundo teste O que você acha que seu professor iria prever para a sua próxima pontuação de teste O que você acha que seus amigos podem prever para a sua próxima pontuação de teste O que você acha que seus pais podem prever para a sua próxima pontuação de teste Todo o blabbing você pôde fazer a seus amigos e pais, eles e seu professor são muito prováveis ​​esperar que você comece algo na área do 85 que você começou apenas. Bem, agora vamos supor que, apesar de sua auto-promoção para seus amigos, você superestimar-se e figura que você pode estudar menos para o segundo teste e assim você começa um 73. Agora o que são todos os interessados ​​e despreocupado vai Antecipar você vai chegar em seu terceiro teste Existem duas abordagens muito provável para que eles desenvolvam uma estimativa, independentemente de se eles vão compartilhar com você. Eles podem dizer a si mesmos: "Esse cara está sempre soprando fumaça sobre suas espertinas. Hes que vai obter outro 73 se hes afortunado. Talvez os pais tentem ser mais solidários e dizer: "Bem, até agora você tem obtido um 85 e um 73, então talvez você deve figura em obter cerca de um (85 73) / 2 79. Eu não sei, talvez se você fez menos Festejando e werent abanando a doninhas em todo o lugar e se você começou a fazer muito mais estudando você poderia obter uma pontuação mais alta. quot Ambas as estimativas são, na verdade, média móvel previsões. O primeiro é usar apenas sua pontuação mais recente para prever o seu desempenho futuro. Isso é chamado de média móvel usando um período de dados. A segunda também é uma média móvel, mas usando dois períodos de dados. Vamos supor que todas essas pessoas rebentando em sua grande mente têm tipo de puto você fora e você decidir fazer bem no terceiro teste para suas próprias razões e colocar uma pontuação mais alta na frente de seus quotalliesquot. Você toma o teste e sua pontuação é realmente um 89 Todos, incluindo você, está impressionado. Então agora você tem o teste final do semestre chegando e, como de costume, você sente a necessidade de incitar todo mundo a fazer suas predições sobre como você vai fazer no último teste. Bem, espero que você veja o padrão. Agora, espero que você possa ver o padrão. Qual você acha que é o apito mais preciso enquanto trabalhamos. Agora vamos voltar para a nossa nova empresa de limpeza iniciada por sua meia irmã distante chamado Whistle While We Work. Você tem alguns dados de vendas anteriores representados na seção a seguir de uma planilha. Primeiro, apresentamos os dados para uma previsão média móvel de três períodos. A entrada para a célula C6 deve ser Agora você pode copiar esta fórmula de célula para baixo para as outras células C7 a C11. Observe como a média se move sobre os dados históricos mais recentes, mas usa exatamente os três períodos mais recentes disponíveis para cada previsão. Você também deve notar que nós realmente não precisamos fazer as previsões para os períodos passados, a fim de desenvolver a nossa previsão mais recente. Isto é definitivamente diferente do modelo de suavização exponencial. Ive incluído o quotpast previsõesquot porque vamos usá-los na próxima página da web para medir a validade de previsão. Agora eu quero apresentar os resultados análogos para uma previsão média móvel de dois períodos. A entrada para a célula C5 deve ser Agora você pode copiar esta fórmula de célula para baixo para as outras células C6 a C11. Observe como agora apenas as duas mais recentes peças de dados históricos são utilizados para cada previsão. Mais uma vez incluí as previsões quotpast para fins ilustrativos e para uso posterior na validação de previsão. Algumas outras coisas que são de importância notar. Para uma previsão média móvel de m-período, apenas os m valores de dados mais recentes são usados ​​para fazer a previsão. Nada mais é necessário. Para uma previsão média móvel do período m, ao fazer previsões quotpast, note que a primeira predição ocorre no período m 1. Ambas as questões serão muito significativas quando desenvolvemos nosso código. Desenvolvendo a função de média móvel. Agora precisamos desenvolver o código para a previsão da média móvel que pode ser usado de forma mais flexível. O código segue. Observe que as entradas são para o número de períodos que você deseja usar na previsão ea matriz de valores históricos. Você pode armazená-lo em qualquer pasta de trabalho que você deseja. Função MovingAverage (Histórico, NumberOfPeriods) Como Único Declarar e inicializar variáveis ​​Dim Item Como variante Dim Counter Como Inteiro Dim Acumulação como único Dim HistoricalSize As Inteiro Inicializando variáveis ​​Counter 1 Acumulação 0 Determinando o tamanho da Historical array HistoricalSize Historical. Count For Counter 1 To NumberOfPeriods Acumulando o número apropriado dos valores mais recentes anteriormente observados Acumulação Acumulação Histórico (HistoricalSize - NumberOfPeriods Counter) MovingAverage Acumulação / NumberOfPeriods O código será explicado na classe. Você deseja posicionar a função na planilha de modo que o resultado da computação apareça onde ele deve gostar da seguinte média de movimento: média de dados de séries temporais (observações igualmente espaçadas no tempo) de vários períodos consecutivos. Chamado de movimento porque é continuamente recalculado à medida que novos dados se tornam disponíveis, ele progride caindo o valor mais antigo e adicionando o valor mais recente. Por exemplo, a média móvel das vendas de seis meses pode ser calculada tomando a média das vendas de janeiro a junho, depois a média das vendas de fevereiro a julho, depois de março a agosto, e assim por diante. As médias móveis (1) reduzem o efeito de variações temporárias nos dados, (2) melhoram o ajuste dos dados para uma linha (um processo chamado suavização) para mostrar a tendência dos dados mais claramente e (3) realçam qualquer valor acima ou abaixo do valor tendência. Se você está calculando algo com variação muito alta o melhor que você pode ser capaz de fazer é descobrir a média móvel. Eu queria saber qual era a média móvel dos dados, então eu teria uma melhor compreensão de como estávamos fazendo. Quando você está tentando descobrir alguns números que mudam muitas vezes o melhor que você pode fazer é calcular a média móvel. Como um exemplo de SMA, considere uma segurança com os seguintes preços de fechamento em 15 dias: Semana 1 (5 dias) 20, 22, 24, 25, 23 Semana 2 (5 dias) 26, 28, 26, 29, 27 Semana 3 (5 dias) 28, 30, 27, 29, 28 Uma MA de 10 dias seria a média dos preços de fechamento para os primeiros 10 dias como o primeiro ponto de dados. O ponto de dados seguinte iria cair o preço mais antigo, adicionar o preço no dia 11 e tomar a média, e assim por diante, como mostrado abaixo. Conforme mencionado anteriormente, MAs atraso ação preço atual, porque eles são baseados em preços passados ​​quanto maior for o período de tempo para o MA, maior o atraso. Assim, um MA de 200 dias terá um grau muito maior de atraso do que um MA de 20 dias porque contém preços nos últimos 200 dias. A duração da MA a ser utilizada depende dos objetivos de negociação, com MAs mais curtos usados ​​para negociação de curto prazo e MAs de longo prazo mais adequados para investidores de longo prazo. O MA de 200 dias é amplamente seguido por investidores e comerciantes, com quebras acima e abaixo desta média móvel considerada como sinais comerciais importantes. MAs também transmitir sinais comerciais importantes por conta própria, ou quando duas médias se cruzam. Um aumento MA indica que a segurança está em uma tendência de alta. Enquanto um declínio MA indica que ele está em uma tendência de baixa. Da mesma forma, o impulso ascendente é confirmado com um crossover de alta. Que ocorre quando um MA de curto prazo cruza acima de um MA de longo prazo. O impulso para baixo é confirmado com um crossover de baixa, o que ocorre quando um MA de curto prazo cruza abaixo de um MA de longo prazo. Na prática, a média móvel fornecerá uma boa estimativa da média das séries temporais se a média for constante ou lentamente alterada . No caso de uma média constante, o maior valor de m dará as melhores estimativas da média subjacente. Um período de observação mais longo medirá os efeitos da variabilidade. O objetivo de fornecer um m menor é permitir que a previsão responda a uma mudança no processo subjacente. Para ilustrar, propomos um conjunto de dados que incorpora mudanças na média subjacente das séries temporais. A figura mostra a série de tempo usada para ilustração juntamente com a demanda média a partir da qual a série foi gerada. A média começa como uma constante em 10. Começando no tempo 21, ele aumenta em uma unidade em cada período até atingir o valor de 20 no tempo 30. Então ele se torna constante novamente. Os dados são simulados adicionando à média um ruído aleatório de uma distribuição Normal com média zero e desvio padrão 3. Os resultados da simulação são arredondados para o número inteiro mais próximo. A tabela mostra as observações simuladas usadas para o exemplo. Quando usamos a tabela, devemos lembrar que a qualquer momento, apenas os dados passados ​​são conhecidos. As estimativas do parâmetro do modelo, para três valores diferentes de m, são mostradas juntamente com a média das séries temporais na figura abaixo. A figura mostra a estimativa média móvel da média em cada momento e não a previsão. As previsões mudariam as curvas da média móvel para a direita por períodos. Uma conclusão é imediatamente aparente a partir da figura. Para as três estimativas, a média móvel está aquém da tendência linear, com o atraso aumentando com m. O atraso é a distância entre o modelo ea estimativa na dimensão temporal. Devido ao atraso, a média móvel subestima as observações à medida que a média está aumentando. O viés do estimador é a diferença em um tempo específico no valor médio do modelo eo valor médio predito pela média móvel. O viés quando a média está aumentando é negativo. Para uma média decrescente, o viés é positivo. O atraso no tempo e o viés introduzido na estimativa são funções de m. Quanto maior o valor de m. Maior a magnitude do atraso e do viés. Para uma série de crescimento contínuo com tendência a. Os valores de lag e viés do estimador da média são dados nas equações abaixo. As curvas de exemplo não correspondem a essas equações porque o modelo de exemplo não está aumentando continuamente, em vez disso, ele começa como uma constante, muda para uma tendência e, em seguida, torna-se constante novamente. Também as curvas de exemplo são afetadas pelo ruído. A previsão média móvel de períodos no futuro é representada deslocando as curvas para a direita. O atraso e o viés aumentam proporcionalmente. As equações abaixo indicam o atraso e o viés de um período de previsão para o futuro quando comparado com os parâmetros do modelo. Novamente, essas fórmulas são para uma série de tempo com uma tendência linear constante. Não devemos nos surpreender com esse resultado. O estimador da média móvel baseia-se no pressuposto de uma média constante, eo exemplo tem uma tendência linear na média durante uma parte do período do estudo. Como as séries de tempo real raramente obedecerão exatamente às suposições de qualquer modelo, devemos estar preparados para tais resultados. Podemos também concluir a partir da figura que a variabilidade do ruído tem o maior efeito para m menor. A estimativa é muito mais volátil para a média móvel de 5 do que a média móvel de 20. Temos os desejos conflitantes de aumentar m para reduzir o efeito da variabilidade devido ao ruído e diminuir m para tornar a previsão mais sensível às mudanças Em média O erro é a diferença entre os dados reais e o valor previsto. Se a série temporal é verdadeiramente um valor constante, o valor esperado do erro é zero ea variância do erro é composta por um termo que é uma função de e um segundo termo que é a variância do ruído,. O primeiro termo é a variância da média estimada com uma amostra de m observações, assumindo que os dados provêm de uma população com média constante. Este termo é minimizado fazendo-se o maior possível. Um grande m faz com que a previsão não responda a uma mudança nas séries temporais subjacentes. Para tornar a previsão responsiva às mudanças, queremos que m seja o menor possível (1), mas isso aumenta a variância do erro. A previsão prática requer um valor intermediário. Previsão com o Excel O suplemento de Previsão implementa as fórmulas de média móvel. O exemplo abaixo mostra a análise fornecida pelo add-in para os dados da amostra na coluna B. As primeiras 10 observações são indexadas -9 a 0. Em comparação com a tabela acima, os índices de período são deslocados por -10. As primeiras dez observações fornecem os valores de inicialização para a estimativa e são usados ​​para calcular a média móvel para o período 0. A coluna MA (10) (C) mostra as médias móveis calculadas. O parâmetro de média móvel m está na célula C3. A coluna Fore (1) (D) mostra uma previsão para um período no futuro. O intervalo de previsão está na célula D3. Quando o intervalo de previsão é alterado para um número maior, os números na coluna Fore são deslocados para baixo. A coluna Err (1) (E) mostra a diferença entre a observação e a previsão. Por exemplo, a observação no tempo 1 é 6. O valor previsto a partir da média móvel no tempo 0 é 11.1. O erro é então -5.1. O desvio padrão eo desvio médio médio (MAD) são calculados nas células E6 e E7, respectivamente. Modelos de média móvel e de suavização exponencial Como um primeiro passo para ultrapassar os modelos de média, aleatória e linear, os padrões e tendências não sazonais podem ser Extrapolado usando um modelo de média móvel ou suavização. A suposição básica por trás dos modelos de média e suavização é que a série temporal é estacionária localmente com uma média lentamente variável. Assim, tomamos uma média móvel (local) para estimar o valor atual da média e então usamos isso como a previsão para o futuro próximo. Isto pode ser considerado como um compromisso entre o modelo médio e o modelo aleatório-andar-sem-deriva. A mesma estratégia pode ser usada para estimar e extrapolar uma tendência local. Uma média móvel é muitas vezes chamado de uma versão quotsmoothedquot da série original, porque a média de curto prazo tem o efeito de suavizar os solavancos na série original. Ajustando o grau de suavização (a largura da média móvel), podemos esperar encontrar algum tipo de equilíbrio ótimo entre o desempenho dos modelos de caminhada média e aleatória. O tipo mais simples de modelo de média é o. Média Móvel Simples (igualmente ponderada): A previsão para o valor de Y no tempo t1 que é feita no tempo t é igual à média simples das observações m mais recentes: (Aqui e em outro lugar usarei o símbolo 8220Y-hat8221 para ficar Para uma previsão da série temporal Y feita o mais cedo possível antes de um determinado modelo). Esta média é centrada no período t (m1) / 2, o que implica que a estimativa da média local tenderá a ficar para trás Valor real da média local em cerca de (m1) / 2 períodos. Dessa forma, dizemos que a idade média dos dados na média móvel simples é (m1) / 2 relativa ao período para o qual a previsão é calculada: é a quantidade de tempo em que as previsões tendem a ficar atrás dos pontos de inflexão na dados. Por exemplo, se você estiver fazendo a média dos últimos 5 valores, as previsões serão cerca de 3 períodos atrasados ​​em responder a pontos de viragem. Observe que se m1, o modelo de média móvel simples (SMA) é equivalente ao modelo de caminhada aleatória (sem crescimento). Se m é muito grande (comparável ao comprimento do período de estimação), o modelo SMA é equivalente ao modelo médio. Como com qualquer parâmetro de um modelo de previsão, é costume ajustar o valor de k para obter o melhor quotfitquot aos dados, isto é, os erros de previsão mais pequenos em média. Aqui está um exemplo de uma série que parece apresentar flutuações aleatórias em torno de uma média de variação lenta. Primeiro, vamos tentar ajustá-lo com um modelo de caminhada aleatória, o que equivale a uma média móvel simples de um termo: O modelo de caminhada aleatória responde muito rapidamente às mudanças na série, mas ao fazê-lo ele escolhe grande parte do quotnoisequot na Dados (as flutuações aleatórias), bem como o quotsignalquot (a média local). Se, em vez disso, tentarmos uma média móvel simples de 5 termos, obtemos um conjunto de previsões mais suaves: A média móvel simples de 5 períodos produz erros significativamente menores do que o modelo de caminhada aleatória neste caso. A idade média dos dados nessa previsão é de 3 ((51) / 2), de modo que ela tende a ficar atrás de pontos de viragem em cerca de três períodos. (Por exemplo, uma desaceleração parece ter ocorrido no período 21, mas as previsões não virar até vários períodos mais tarde.) Observe que as previsões de longo prazo do modelo SMA são uma linha reta horizontal, assim como na caminhada aleatória modelo. Assim, o modelo SMA assume que não há tendência nos dados. No entanto, enquanto as previsões do modelo de caminhada aleatória são simplesmente iguais ao último valor observado, as previsões do modelo SMA são iguais a uma média ponderada de valores recentes. Os limites de confiança calculados pela Statgraphics para as previsões de longo prazo da média móvel simples não se ampliam à medida que o horizonte de previsão aumenta. Isto obviamente não é correto Infelizmente, não há nenhuma teoria estatística subjacente que nos diga como os intervalos de confiança devem se ampliar para este modelo. No entanto, não é muito difícil calcular estimativas empíricas dos limites de confiança para as previsões de longo prazo. Por exemplo, você poderia configurar uma planilha em que o modelo SMA seria usado para prever 2 passos à frente, 3 passos à frente, etc. dentro da amostra de dados históricos. Você poderia então calcular os desvios padrão da amostra dos erros em cada horizonte de previsão e, em seguida, construir intervalos de confiança para previsões de longo prazo adicionando e subtraindo múltiplos do desvio padrão apropriado. Se tentarmos uma média móvel simples de 9 termos, obtemos previsões ainda mais suaves e mais de um efeito retardado: A idade média é agora de 5 períodos ((91) / 2). Se tomarmos uma média móvel de 19 períodos, a idade média aumenta para 10: Observe que, na verdade, as previsões estão agora atrasadas por pontos de inflexão em cerca de 10 períodos. Qual a quantidade de suavização é melhor para esta série Aqui está uma tabela que compara suas estatísticas de erro, incluindo também uma média de 3-termo: Modelo C, a média móvel de 5-termo, rende o menor valor de RMSE por uma pequena margem sobre o 3 E médias de 9-termo, e suas outras estatísticas são quase idênticas. Assim, entre os modelos com estatísticas de erro muito semelhantes, podemos escolher se preferiríamos um pouco mais de resposta ou um pouco mais de suavidade nas previsões. O modelo de média móvel simples descrito acima tem a propriedade indesejável de tratar as últimas k observações igualmente e completamente ignora todas as observações anteriores. (Voltar ao início da página.) Marrons Simples Exponencial Suavização (exponencialmente ponderada média móvel) Intuitivamente, os dados passados ​​devem ser descontados de forma mais gradual - por exemplo, a observação mais recente deve ter um pouco mais de peso que a segunda mais recente, ea segunda mais recente deve ter um pouco mais de peso que a 3ª mais recente, e em breve. O modelo de suavização exponencial simples (SES) realiza isso. Vamos 945 denotar uma constante quotsmoothingquot (um número entre 0 e 1). Uma maneira de escrever o modelo é definir uma série L que represente o nível atual (isto é, o valor médio local) da série, conforme estimado a partir dos dados até o presente. O valor de L no instante t é calculado recursivamente a partir de seu próprio valor anterior como este: Assim, o valor suavizado atual é uma interpolação entre o valor suavizado anterior e a observação atual, onde 945 controla a proximidade do valor interpolado para o mais recente observação. A previsão para o próximo período é simplesmente o valor suavizado atual: Equivalentemente, podemos expressar a próxima previsão diretamente em termos de previsões anteriores e observações anteriores, em qualquer uma das seguintes versões equivalentes. Na primeira versão, a previsão é uma interpolação entre previsão anterior e observação anterior: Na segunda versão, a próxima previsão é obtida ajustando a previsão anterior na direção do erro anterior por uma fração 945. é o erro feito em Tempo t. Na terceira versão, a previsão é uma média móvel exponencialmente ponderada (ou seja, descontada) com o fator de desconto 1- 945: A versão de interpolação da fórmula de previsão é a mais simples de usar se você estiver implementando o modelo em uma planilha: Célula única e contém referências de células que apontam para a previsão anterior, a observação anterior ea célula onde o valor de 945 é armazenado. Observe que se 945 1, o modelo SES é equivalente a um modelo de caminhada aleatória (sem crescimento). Se 945 0, o modelo SES é equivalente ao modelo médio, assumindo que o primeiro valor suavizado é definido igual à média. A idade média dos dados na previsão de suavização exponencial simples é de 1/945 em relação ao período para o qual a previsão é calculada. (Isso não é suposto ser óbvio, mas pode ser facilmente demonstrado através da avaliação de uma série infinita.) Portanto, a previsão média móvel simples tende a ficar para trás de pontos de viragem em cerca de 1/945 períodos. Por exemplo, quando 945 0,5 o atraso é 2 períodos quando 945 0,2 o atraso é de 5 períodos quando 945 0,1 o atraso é de 10 períodos, e assim por diante. Para uma dada idade média (isto é, a quantidade de atraso), a previsão de suavização exponencial simples (SES) é um pouco superior à previsão de média móvel simples (SMA) porque coloca relativamente mais peso na observação mais recente - i. e. É ligeiramente mais quotresponsivequot às mudanças que ocorrem no passado recente. Por exemplo, um modelo SMA com 9 termos e um modelo SES com 945 0,2 têm uma idade média de 5 para os dados nas suas previsões, mas o modelo SES coloca mais peso nos últimos 3 valores do que o modelo SMA e no modelo SMA. Outra vantagem importante do modelo SES sobre o modelo SMA é que o modelo SES usa um parâmetro de suavização que é continuamente variável, de modo que pode ser facilmente otimizado Usando um algoritmo quotsolverquot para minimizar o erro quadrático médio. O valor óptimo de 945 no modelo SES para esta série revela-se 0.2961, como mostrado aqui: A idade média dos dados nesta previsão é de 1 / 0.2961 3.4 períodos, que é semelhante ao de um 6-termo simples de movimento média. As previsões a longo prazo do modelo SES são uma linha reta horizontal. Como no modelo SMA eo modelo de caminhada aleatória sem crescimento. No entanto, note que os intervalos de confiança calculados por Statgraphics agora divergem de uma forma razoavelmente aparente, e que eles são substancialmente mais estreitos do que os intervalos de confiança para o modelo de caminhada aleatória. O modelo SES assume que a série é um tanto mais previsível do que o modelo de caminhada aleatória. Um modelo SES é realmente um caso especial de um modelo ARIMA. De modo que a teoria estatística dos modelos ARIMA fornece uma base sólida para o cálculo de intervalos de confiança para o modelo SES. Em particular, um modelo SES é um modelo ARIMA com uma diferença não sazonal, um termo MA (1) e nenhum termo constante. Também conhecido como um modelo quimétrico ARIMA (0,1,1) sem constantequot. O coeficiente MA (1) no modelo ARIMA corresponde à quantidade 1-945 no modelo SES. Por exemplo, se você ajustar um modelo ARIMA (0,1,1) sem constante à série aqui analisada, o coeficiente MA estimado (1) resulta ser 0,7029, que é quase exatamente um menos 0,2961. É possível adicionar a hipótese de uma tendência linear constante não-zero para um modelo SES. Para isso, basta especificar um modelo ARIMA com uma diferença não sazonal e um termo MA (1) com uma constante, ou seja, um modelo ARIMA (0,1,1) com constante. As previsões a longo prazo terão então uma tendência que é igual à tendência média observada ao longo de todo o período de estimação. Você não pode fazer isso em conjunto com o ajuste sazonal, porque as opções de ajuste sazonal são desativadas quando o tipo de modelo é definido como ARIMA. No entanto, você pode adicionar uma tendência exponencial de longo prazo constante a um modelo de suavização exponencial simples (com ou sem ajuste sazonal) usando a opção de ajuste de inflação no procedimento de Previsão. A taxa adequada de inflação (crescimento percentual) por período pode ser estimada como o coeficiente de declive num modelo de tendência linear ajustado aos dados em conjunto com uma transformação de logaritmo natural, ou pode basear-se em outras informações independentes relativas às perspectivas de crescimento a longo prazo . (Retornar ao início da página.) Browns Linear (ie double) Suavização exponencial Os modelos SMA e SES assumem que não há nenhuma tendência de qualquer tipo nos dados (que geralmente é OK ou pelo menos não muito ruim para 1- Antecipadamente quando os dados são relativamente ruidosos) e podem ser modificados para incorporar uma tendência linear constante como mostrado acima. O que acontece com as tendências a curto prazo Se uma série exibe uma taxa variável de crescimento ou um padrão cíclico que se destaca claramente contra o ruído, e se houver uma necessidade de prever mais de um período à frente, a estimativa de uma tendência local também pode ser um problema. O modelo de suavização exponencial simples pode ser generalizado para obter um modelo de suavização exponencial linear (LES) que calcula estimativas locais de nível e tendência. O modelo de tendência de variação de tempo mais simples é o modelo de alisamento exponencial linear de Browns, que usa duas séries suavizadas diferentes que são centradas em diferentes pontos no tempo. A fórmula de previsão é baseada em uma extrapolação de uma linha através dos dois centros. (Uma versão mais sofisticada deste modelo, Holt8217s, é discutida abaixo). A forma algébrica do modelo de suavização exponencial linear de Brown8217s, como a do modelo de suavização exponencial simples, pode ser expressa em um número de formas diferentes mas equivalentes. A forma quotstandard deste modelo é usualmente expressa da seguinte maneira: Seja S a série de suavização simples obtida pela aplicação de suavização exponencial simples à série Y. Ou seja, o valor de S no período t é dado por: (Lembre-se que, sob simples Exponencial, esta seria a previsão para Y no período t1.) Então deixe Squot denotar a série duplamente-alisada obtida aplicando a suavização exponencial simples (usando o mesmo 945) à série S: Finalmente, a previsão para Y tk. Para qualquer kgt1, é dada por: Isto produz e 1 0 (isto é, enganar um pouco e deixar a primeira previsão igual à primeira observação real) e e 2 Y 2 8211 Y 1. Após o que as previsões são geradas usando a equação acima. Isto produz os mesmos valores ajustados que a fórmula baseada em S e S se estes últimos foram iniciados utilizando S 1 S 1 Y 1. Esta versão do modelo é usada na próxima página que ilustra uma combinação de suavização exponencial com ajuste sazonal. Holt8217s Linear Exponential Smoothing Brown8217s O modelo LES calcula estimativas locais de nível e tendência ao suavizar os dados recentes, mas o fato de que ele faz isso com um único parâmetro de suavização coloca uma restrição nos padrões de dados que é capaz de ajustar: o nível ea tendência Não são permitidos variar em taxas independentes. Holt8217s modelo LES aborda esta questão, incluindo duas constantes de alisamento, um para o nível e um para a tendência. Em qualquer momento t, como no modelo Brown8217s, existe uma estimativa L t do nível local e uma estimativa T t da tendência local. Aqui eles são calculados recursivamente a partir do valor de Y observado no tempo t e as estimativas anteriores do nível e tendência por duas equações que aplicam alisamento exponencial para eles separadamente. Se o nível estimado ea tendência no tempo t-1 forem L t82091 e T t-1. Respectivamente, então a previsão para Y tshy que teria sido feita no tempo t-1 é igual a L t-1 T t-1. Quando o valor real é observado, a estimativa atualizada do nível é calculada recursivamente pela interpolação entre Y tshy e sua previsão, L t-1 T t-1, usando pesos de 945 e 1-945. A mudança no nível estimado, Nomeadamente L t 8209 L t82091. Pode ser interpretado como uma medida ruidosa da tendência no tempo t. A estimativa actualizada da tendência é então calculada recursivamente pela interpolação entre L t 8209 L t82091 e a estimativa anterior da tendência, T t-1. Usando pesos de 946 e 1-946: A interpretação da constante de alisamento de tendência 946 é análoga à da constante de alisamento de nível 945. Modelos com valores pequenos de 946 assumem que a tendência muda apenas muito lentamente ao longo do tempo, enquanto modelos com Maior 946 supor que está mudando mais rapidamente. Um modelo com um 946 grande acredita que o futuro distante é muito incerto, porque os erros na tendência-estimativa tornam-se completamente importantes ao prever mais de um período adiante. As constantes de suavização 945 e 946 podem ser estimadas da maneira usual, minimizando o erro quadrático médio das previsões de 1 passo à frente. Quando isso é feito em Statgraphics, as estimativas se tornam 945 0,3048 e 946 0,008. O valor muito pequeno de 946 significa que o modelo assume muito pouca mudança na tendência de um período para o outro, então basicamente este modelo está tentando estimar uma tendência de longo prazo. Por analogia com a noção de idade média dos dados que é usada na estimativa do nível local da série, a idade média dos dados que é usada na estimativa da tendência local é proporcional a 1/946, embora não exatamente igual a isto. Neste caso, isto é 1 / 0.006 125. Este número é muito preciso, na medida em que a precisão da estimativa de 946 é realmente de 3 casas decimais, mas é da mesma ordem geral de magnitude que o tamanho da amostra de 100 , Assim que este modelo está calculando a média sobre bastante muita história em estimar a tendência. O gráfico de previsão abaixo mostra que o modelo LES estima uma tendência local ligeiramente maior no final da série do que a tendência constante estimada no modelo SEStrend. Além disso, o valor estimado de 945 é quase idêntico ao obtido pelo ajuste do modelo SES com ou sem tendência, de modo que este é quase o mesmo modelo. Agora, eles parecem previsões razoáveis ​​para um modelo que é suposto estar estimando uma tendência local Se você 8220eyeball8221 esse enredo, parece que a tendência local virou para baixo no final da série O que aconteceu Os parâmetros deste modelo Foram estimados minimizando o erro quadrático das previsões de um passo à frente, e não as previsões a mais longo prazo, caso em que a tendência não faz muita diferença. Se tudo o que você está olhando são 1-passo-frente erros, você não está vendo a imagem maior de tendências sobre (digamos) 10 ou 20 períodos. A fim de obter este modelo mais em sintonia com a nossa extrapolação do globo ocular dos dados, podemos ajustar manualmente a tendência de suavização constante para que ele usa uma linha de base mais curto para estimativa de tendência. Por exemplo, se escolhemos definir 946 0,1, então a idade média dos dados usados ​​na estimativa da tendência local é de 10 períodos, o que significa que estamos fazendo uma média da tendência ao longo dos últimos 20 períodos aproximadamente. Here8217s o que o lote de previsão parece se ajustarmos 946 0.1 mantendo 945 0.3. Isso parece intuitivamente razoável para esta série, embora seja provavelmente perigoso para extrapolar esta tendência mais de 10 períodos no futuro. E sobre as estatísticas de erro Aqui está uma comparação de modelos para os dois modelos mostrados acima, bem como três modelos SES. O valor ótimo de 945 para o modelo SES é de aproximadamente 0,3, mas resultados semelhantes (com ligeiramente mais ou menos responsividade, respectivamente) são obtidos com 0,5 e 0,2. (A) Holts linear exp. Alisamento com alfa 0,3048 e beta 0,008 (B) Holts linear exp. Alisamento com alfa 0,3 e beta 0,1 (C) Alisamento exponencial simples com alfa 0,5 (D) Alisamento exponencial simples com alfa 0,3 (E) Alisamento exponencial simples com alfa 0,2 Suas estatísticas são quase idênticas, então realmente não podemos fazer a escolha com base De erros de previsão de 1 passo à frente dentro da amostra de dados. Temos de recorrer a outras considerações. Se acreditarmos firmemente que faz sentido basear a estimativa de tendência atual sobre o que aconteceu nos últimos 20 períodos, podemos fazer um caso para o modelo LES com 945 0,3 e 946 0,1. Se quisermos ser agnósticos quanto à existência de uma tendência local, então um dos modelos SES pode ser mais fácil de explicar e também fornecerá mais previsões de médio-caminho para os próximos 5 ou 10 períodos. Evidências empíricas sugerem que, se os dados já tiverem sido ajustados (se necessário) para a inflação, então pode ser imprudente extrapolar os resultados lineares de curto prazo Muito para o futuro. As tendências evidentes hoje podem afrouxar no futuro devido às causas variadas tais como a obsolescência do produto, a competição aumentada, e os abrandamentos cíclicos ou as ascensões em uma indústria. Por esta razão, a suavização exponencial simples geralmente desempenha melhor fora da amostra do que seria de esperar, apesar da sua extrapolação de tendência horizontal quotnaivequot. Modificações de tendência amortecida do modelo de suavização exponencial linear também são freqüentemente usadas na prática para introduzir uma nota de conservadorismo em suas projeções de tendência. O modelo LES com tendência a amortecimento pode ser implementado como um caso especial de um modelo ARIMA, em particular, um modelo ARIMA (1,1,2). É possível calcular intervalos de confiança em torno de previsões de longo prazo produzidas por modelos exponenciais de suavização, considerando-os como casos especiais de modelos ARIMA. A largura dos intervalos de confiança depende de (i) o erro RMS do modelo, (ii) o tipo de suavização (simples ou linear) (iii) o valor (S) da (s) constante (s) de suavização e (iv) o número de períodos que você está prevendo. Em geral, os intervalos se espalham mais rapidamente à medida que o 945 se torna maior no modelo SES e eles se espalham muito mais rápido quando se usa linear ao invés de alisamento simples. Este tópico é discutido mais adiante na seção de modelos ARIMA das notas. (Voltar ao topo da página.)

No comments:

Post a Comment