Friday, 28 July 2017

Regressão Média Móvel Ponderada Exponencialmente


Dada uma série de tempo xi, eu quero calcular uma média móvel ponderada com uma janela de média de N pontos, onde as ponderações favorecem valores mais recentes sobre valores mais antigos. Na escolha dos pesos, estou usando o fato familiar de que uma série geométrica converge para 1, isto é, soma (frac) k, desde que infinitamente muitos termos sejam tomados. Para obter um número discreto de pesos que somam a unidade, estou simplesmente tomando os primeiros N termos da série geométrica (frac) k, e então normalizando pela sua soma. Quando N4, por exemplo, isto dá os pesos não normalizados que, depois de normalizados pela sua soma, dão A média móvel é então simplesmente a soma do produto dos 4 valores mais recentes contra estes pesos normalizados. Este método generaliza da maneira óbvia para mover janelas de comprimento N, e parece computacionalmente fácil também. Existe alguma razão para não usar esta maneira simples para calcular uma média móvel ponderada usando pesos exponenciais eu pergunto porque a entrada Wikipedia para EWMA parece mais complicado. O que me faz me perguntar se a definição do manual de EWMA talvez tenha algumas propriedades estatísticas que a definição acima simples não Ou eles são de fato equivalente perguntado Nov 28 12 at 23:53 Para começar com o seu estão assumindo 1) que não existem valores incomuns E sem mudanças de nível e sem tendências de tempo e sem dummies sazonais 2) que a média ponderada ideal tem pesos que caem em uma curva lisa descrita por 1 coeficiente 3) que a variância de erro é constante que não há série causal conhecida Por que todos os premissas. Ndash IrishStat Oct 1 14 at 21:18 Ravi: No exemplo dado, a soma dos quatro primeiros termos é 0.9375 0.06250.1250.250.5. Assim, os quatro primeiros termos detém 93,8 do peso total (6,2 é na cauda truncada). Use isso para obter pesos normalizados que somam a unidade por reescalonamento (divisão) por 0,9375. Isto dá 0,06667, 0,1333, 0,2667, 0,5333. Ndash Assad Ebrahim Oct 1 14 at 22:21 Ive descobriu que a computação ponderada exponetially médias correntes usando overline leftarrow overline alfa (x - overline), alphalt1 é um método simples de uma linha, que é facilmente, se apenas aproximadamente, interpretável em termos de Um número efetivo de amostras Nalpha (compare esta forma com a forma para calcular a média de execução), requer apenas o datum atual (eo valor médio atual) e é numericamente estável. Tecnicamente, essa abordagem incorpora toda a história na média. As duas principais vantagens da utilização da janela completa (em oposição à truncada discutida na pergunta) são que em alguns casos pode facilitar a caracterização analítica da filtragem e reduz as flutuações induzidas se um dado muito grande (ou pequeno) Valor é parte do conjunto de dados. Por exemplo, considere o resultado do filtro se os dados são todos zero, exceto um dado cujo valor é 106. Se você está procurando uma equação da forma yalphan betan x após n pedaços de dados entraram, E você está usando um fator exponencial k ge 1 então você poderia usar betan frac n kiright) esquerda (soma n ki Xi Yiright) - esquerda (soma n ki Xiright) esquerda (soma n ki Yiright) n kiright) esquerda (soma n ki Xi2right) - esquerda (soma n ki Xi direita) 2 alphan frac n ki Yiright) - betan esquerda (soma n ki Xiright) n ki. Se arredondamento ou velocidade tornam-se problemas, isso pode ser reformulado em outras formas. Também pode valer a pena saber que para kgt1 você tem soma n ki frac. (B) / PHI (B) / PHI (B) a (t) o operador THETA (B) / PHI (B) ) É o componente de suavização. Por exemplo, se PHI (B) 1.0 e THETA (B) 1-.5B isso implicaria um conjunto de pesos de .5, .25, .125. Desta forma você poderia fornecer a resposta para otimizar a regressão linear em movimento ponderada, em vez de assumir sua forma. Respondeu Apr 25 11 at 10:49 Sim, você pode. O método que você está procurando é chamado método de mínimos quadrados ponderado exponencialmente. É uma variação do método dos mínimos quadrados recursivos: k1 (k1) k (k1) x (k1) k (k1) (K1) D (k1) D (k1) D (k1) D (k1) D (k) D (k) D (k) K) bigg) fim 0,9ltlt1 tipicamente. É um método desenvolvido para contabilizar parâmetros variando no tempo, mas ainda está em um formato linear. Que vem da função de custo: J () 1/2 (ik-m) k (ki) z (i) - xT (i) 2 Ordinário Os mínimos quadrados são calculados a partir da seguinte comparação: ) 1/2 (ii) kz (i) - xT (i) 2 com início (k) amp D (k) XkT Zk Cov (k) amp 2 D (k) 14 às 21:41 gung 74k 9679 19 9679 160 9679 309 Bem-vindo ao site, MohSahx Seria mais claro se você pode editar suas fórmulas em látex. Especialmente para rever os símbolos como. Ndash Jiebiao Wang Jan 3 14 at 22: 06Exploring A média ponderada exponencial da volatilidade é a medida mais comum de risco, mas vem em vários sabores. Em artigo anterior, mostramos como calcular a volatilidade histórica simples. (Para ler este artigo, consulte Usando a volatilidade para avaliar o risco futuro.) Usamos os dados reais do estoque do Google para computar a volatilidade diária com base em 30 dias de dados de estoque. Neste artigo, melhoraremos a volatilidade simples e discutiremos a média móvel exponencialmente ponderada (EWMA). Histórico vs. Volatilidade implícita Primeiro, vamos colocar essa métrica em um pouco de perspectiva. Existem duas abordagens gerais: volatilidade histórica e implícita (ou implícita). A abordagem histórica pressupõe que o passado é um prólogo que medimos a história na esperança de que ela seja preditiva. A volatilidade implícita, por outro lado, ignora a história que resolve pela volatilidade implícita nos preços de mercado. Espera que o mercado saiba melhor e que o preço de mercado contenha, mesmo que implicitamente, uma estimativa consensual da volatilidade. Se nos concentrarmos apenas nas três abordagens históricas (à esquerda acima), elas têm duas etapas em comum: Calcular a série de retornos periódicos Aplicar um esquema de ponderação Primeiro, nós Calcular o retorno periódico. Isso é tipicamente uma série de retornos diários onde cada retorno é expresso em termos continuamente compostos. Para cada dia, tomamos o log natural da razão dos preços das ações (ou seja, preço hoje dividido pelo preço de ontem, e assim por diante). Isso produz uma série de retornos diários, de u i para u i-m. Dependendo de quantos dias (m dias) estamos medindo. Isso nos leva à segunda etapa: é aqui que as três abordagens diferem. No artigo anterior (Usando a Volatilidade Para Avaliar o Risco Futuro), mostramos que sob algumas simplificações aceitáveis, a variância simples é a média dos retornos ao quadrado: Observe que isto soma cada um dos retornos periódicos, então divide esse total pela Número de dias ou observações (m). Então, é realmente apenas uma média dos retornos periódicos quadrados. Dito de outra forma, cada retorno ao quadrado é dado um peso igual. Portanto, se alfa (a) é um fator de ponderação (especificamente, 1 / m), então uma variância simples se parece com isso: O EWMA Melhora na Variância Simples A fraqueza desta abordagem é que todos os retornos ganham o mesmo peso. O retorno de ontem (muito recente) não tem mais influência na variância do que nos últimos meses. Esse problema é corrigido usando-se a média móvel exponencialmente ponderada (EWMA), na qual os retornos mais recentes têm maior peso na variância. A média móvel exponencialmente ponderada (EWMA) introduz lambda. Que é chamado de parâmetro de suavização. Lambda deve ser inferior a um. Sob essa condição, em vez de pesos iguais, cada retorno ao quadrado é ponderado por um multiplicador da seguinte forma: Por exemplo, RiskMetrics TM, uma empresa de gestão de risco financeiro, tende a usar um lambda de 0,94 ou 94. Neste caso, o primeiro Mais recente) é ponderado por (1-0.94) (. 94) 0 6. O próximo retomo quadrado é simplesmente um lambda-múltiplo do peso anterior neste caso 6 multiplicado por 94 5.64. E o terceiro dia anterior peso é igual a (1-0,94) (0,94) 2 5,30. Esse é o significado de exponencial em EWMA: cada peso é um multiplicador constante (isto é, lambda, que deve ser menor que um) do peso dos dias anteriores. Isso garante uma variância que é ponderada ou tendenciosa em direção a dados mais recentes. (Para saber mais, consulte a Planilha do Excel para a Volatilidade do Google.) A diferença entre simplesmente volatilidade e EWMA para o Google é mostrada abaixo. A volatilidade simples pesa efetivamente cada retorno periódico em 0,196, como mostrado na coluna O (tivemos dois anos de dados diários sobre os preços das ações, ou seja, 509 retornos diários e 1/509 0,196). Mas observe que a Coluna P atribui um peso de 6, então 5.64, então 5.3 e assim por diante. Essa é a única diferença entre a variância simples e EWMA. Lembre-se: Depois de somar toda a série (na coluna Q) temos a variância, que é o quadrado do desvio padrão. Se queremos a volatilidade, precisamos nos lembrar de tomar a raiz quadrada dessa variância. Sua significativa: A variância simples nos deu uma volatilidade diária de 2,4, mas a EWMA deu uma volatilidade diária de apenas 1,4 (veja a planilha para detalhes). Aparentemente, volatilidade Googles estabeleceu-se mais recentemente, portanto, uma variância simples pode ser artificialmente elevado. A variação de hoje é uma função da variação dos dias de Pior Você observará que nós precisamos computar uma série longa de pesos exponencial declinando. Nós não faremos a matemática aqui, mas uma das melhores características do EWMA é que toda a série convenientemente reduz a uma fórmula recursiva: Recursivo significa que as referências de variância de hoje (ou seja, é uma função da variação de dias anteriores). Você pode encontrar esta fórmula na folha de cálculo também, e produz o mesmo resultado exato que o cálculo de longhand Diz: A variância de hoje (sob EWMA) é a variância de ontem (ponderada por lambda) mais o retorno ao quadrado de ontem (pesado por um lambda negativo). Observe como estamos apenas adicionando dois termos juntos: ontem variância ponderada e ontem ponderada, retorno ao quadrado. Mesmo assim, lambda é o nosso parâmetro de suavização. Um lambda mais alto (por exemplo, como o RiskMetrics 94) indica um declínio mais lento na série - em termos relativos, vamos ter mais pontos de dados na série e eles vão cair mais lentamente. Por outro lado, se reduzimos o lambda, indicamos maior decaimento: os pesos caem mais rapidamente e, como resultado direto da rápida decadência, são usados ​​menos pontos de dados. (Na planilha, lambda é uma entrada, para que você possa experimentar com sua sensibilidade). Resumo A volatilidade é o desvio padrão instantâneo de um estoque ea métrica de risco mais comum. É também a raiz quadrada da variância. Podemos medir a variância historicamente ou implicitamente (volatilidade implícita). Ao medir historicamente, o método mais fácil é a variância simples. Mas a fraqueza com variância simples é todos os retornos obter o mesmo peso. Então, enfrentamos um trade-off clássico: sempre queremos mais dados, mas quanto mais dados temos, mais nosso cálculo é diluído por dados distantes (menos relevantes). A média móvel exponencialmente ponderada (EWMA) melhora a variância simples atribuindo pesos aos retornos periódicos. Fazendo isso, podemos usar um grande tamanho de amostra, mas também dar maior peso a retornos mais recentes. (Para ver um filme tutorial sobre este tópico, visite o Bionic Turtle.) QuotHINTquot é um acrônimo que significa quothigh renda sem impostos. quot É aplicado a high-assalariados que evitam pagar renda federal. Um fabricante de mercado que compra e vende títulos corporativos de curto prazo, chamados de papel comercial. Um negociante de papel é tipicamente. Uma ordem colocada com uma corretora para comprar ou vender um número definido de ações a um preço especificado ou melhor. A compra e venda irrestrita de bens e serviços entre países sem a imposição de restrições, tais como. No mundo dos negócios, um unicórnio é uma empresa, geralmente uma start-up que não tem um registro de desempenho estabelecido. Uma quantidade que um homeowner deve pagar antes que o seguro cobrirá o dano causado por um furacão. Modelos majando de média e de suavização exponencial Como uma primeira etapa em mover-se além dos modelos médios, os modelos aleatórios da caminhada, e os modelos lineares da tendência, os testes padrões e as tendências não sazonais podem extrapolated using Um modelo de média móvel ou suavização. A suposição básica por trás dos modelos de média e suavização é que a série temporal é localmente estacionária com uma média lentamente variável. Assim, tomamos uma média móvel (local) para estimar o valor atual da média e então usamos isso como a previsão para o futuro próximo. Isto pode ser considerado como um compromisso entre o modelo médio e o modelo aleatório-andar-sem-deriva. A mesma estratégia pode ser usada para estimar e extrapolar uma tendência local. Uma média móvel é muitas vezes chamado de uma versão quotsmoothedquot da série original, porque a média de curto prazo tem o efeito de suavizar os solavancos na série original. Ajustando o grau de suavização (a largura da média móvel), podemos esperar encontrar algum tipo de equilíbrio ótimo entre o desempenho dos modelos de caminhada média e aleatória. O tipo mais simples de modelo de média é o. Média Móvel Simples (igualmente ponderada): A previsão para o valor de Y no tempo t1 que é feita no tempo t é igual à média simples das observações m mais recentes: (Aqui e em outro lugar usarei o símbolo 8220Y-hat8221 para ficar Para uma previsão da série temporal Y feita o mais cedo possível antes de um determinado modelo). Esta média é centrada no período t (m1) / 2, o que implica que a estimativa da média local tenderá a ficar para trás Valor real da média local em cerca de (m1) / 2 períodos. Dessa forma, dizemos que a idade média dos dados na média móvel simples é (m1) / 2 relativa ao período para o qual a previsão é calculada: é a quantidade de tempo em que as previsões tendem a ficar atrás dos pontos de inflexão na dados. Por exemplo, se você estiver calculando a média dos últimos 5 valores, as previsões serão cerca de 3 períodos atrasados ​​em responder a pontos de viragem. Observe que se m1, o modelo de média móvel simples (SMA) é equivalente ao modelo de caminhada aleatória (sem crescimento). Se m é muito grande (comparável ao comprimento do período de estimação), o modelo SMA é equivalente ao modelo médio. Como com qualquer parâmetro de um modelo de previsão, é costume ajustar o valor de k para obter o melhor quotfitquot aos dados, isto é, os erros de previsão mais pequenos em média. Aqui está um exemplo de uma série que parece apresentar flutuações aleatórias em torno de uma média de variação lenta. Primeiro, vamos tentar ajustá-lo com um modelo de caminhada aleatória, o que equivale a uma média móvel simples de um termo: O modelo de caminhada aleatória responde muito rapidamente às mudanças na série, mas ao fazê-lo ele escolhe grande parte do quotnoisequot no Dados (as flutuações aleatórias), bem como o quotsignalquot (a média local). Se, em vez disso, tentarmos uma média móvel simples de 5 termos, obtemos um conjunto de previsões mais suaves: A média móvel simples de 5 períodos produz erros significativamente menores do que o modelo de caminhada aleatória neste caso. A idade média dos dados nessa previsão é de 3 ((51) / 2), de modo que ela tende a ficar atrás de pontos de viragem em cerca de três períodos. (Por exemplo, uma desaceleração parece ter ocorrido no período 21, mas as previsões não virar até vários períodos mais tarde.) Observe que as previsões de longo prazo do modelo SMA são uma linha reta horizontal, assim como na caminhada aleatória modelo. Assim, o modelo SMA assume que não há tendência nos dados. No entanto, enquanto as previsões do modelo de caminhada aleatória são simplesmente iguais ao último valor observado, as previsões do modelo SMA são iguais a uma média ponderada de valores recentes. Os limites de confiança calculados pela Statgraphics para as previsões de longo prazo da média móvel simples não se alargam à medida que o horizonte de previsão aumenta. Isto obviamente não é correto Infelizmente, não há nenhuma teoria estatística subjacente que nos diga como os intervalos de confiança devem se ampliar para este modelo. No entanto, não é muito difícil calcular estimativas empíricas dos limites de confiança para as previsões de longo prazo. Por exemplo, você poderia configurar uma planilha em que o modelo SMA seria usado para prever 2 passos à frente, 3 passos à frente, etc. dentro da amostra de dados históricos. Você poderia então calcular os desvios padrão da amostra dos erros em cada horizonte de previsão e, em seguida, construir intervalos de confiança para previsões de longo prazo adicionando e subtraindo múltiplos do desvio padrão apropriado. Se tentarmos uma média móvel simples de 9 termos, obtemos previsões ainda mais suaves e mais de um efeito retardado: A idade média é agora de 5 períodos ((91) / 2). Se tomarmos uma média móvel de 19 períodos, a idade média aumenta para 10: Observe que, na verdade, as previsões estão agora atrasadas por pontos de inflexão em cerca de 10 períodos. Qual a quantidade de suavização é melhor para esta série Aqui está uma tabela que compara suas estatísticas de erro, incluindo também uma média de 3-termo: Modelo C, a média móvel de 5-termo, rende o menor valor de RMSE por uma pequena margem sobre o 3 E médias de 9-termo, e suas outras estatísticas são quase idênticas. Assim, entre os modelos com estatísticas de erro muito semelhantes, podemos escolher se preferiríamos um pouco mais de resposta ou um pouco mais de suavidade nas previsões. O modelo de média móvel simples descrito acima tem a propriedade indesejável de tratar as últimas k observações igualmente e completamente ignora todas as observações anteriores. (Voltar ao início da página.) Marrons Simples Exponencial Suavização (exponencialmente ponderada média móvel) Intuitivamente, os dados passados ​​devem ser descontados de forma mais gradual - por exemplo, a observação mais recente deve ter um pouco mais de peso que a segunda mais recente, ea segunda mais recente deve ter um pouco mais de peso que a 3ª mais recente, e em breve. O modelo de suavização exponencial simples (SES) realiza isso. Vamos 945 denotar uma constante quotsmoothingquot (um número entre 0 e 1). Uma maneira de escrever o modelo é definir uma série L que represente o nível atual (isto é, o valor médio local) da série, conforme estimado a partir dos dados até o presente. O valor de L no tempo t é calculado recursivamente a partir de seu próprio valor anterior como este: Assim, o valor suavizado atual é uma interpolação entre o valor suavizado anterior e a observação atual, onde 945 controla a proximidade do valor interpolado para o mais recente observação. A previsão para o próximo período é simplesmente o valor suavizado atual: Equivalentemente, podemos expressar a próxima previsão diretamente em termos de previsões anteriores e observações anteriores, em qualquer uma das seguintes versões equivalentes. Na primeira versão, a previsão é uma interpolação entre previsão anterior e observação anterior: Na segunda versão, a próxima previsão é obtida ajustando a previsão anterior na direção do erro anterior por uma fração 945. é o erro feito em Tempo t. Na terceira versão, a previsão é uma média móvel exponencialmente ponderada (ou seja, descontada) com o fator de desconto 1- 945: A versão de interpolação da fórmula de previsão é a mais simples de usar se você estiver implementando o modelo em uma planilha: Célula única e contém referências de células que apontam para a previsão anterior, a observação anterior ea célula onde o valor de 945 é armazenado. Observe que se 945 1, o modelo SES é equivalente a um modelo de caminhada aleatória (sem crescimento). Se 945 0, o modelo SES é equivalente ao modelo médio, assumindo que o primeiro valor suavizado é definido igual à média. A idade média dos dados na previsão de suavização exponencial simples é de 1/945 em relação ao período para o qual a previsão é calculada. (Isso não é suposto ser óbvio, mas pode ser facilmente demonstrado através da avaliação de uma série infinita.) Portanto, a previsão média móvel simples tende a ficar para trás de pontos de viragem em cerca de 1/945 períodos. Por exemplo, quando 945 0,5 o atraso é 2 períodos quando 945 0,2 o atraso é de 5 períodos quando 945 0,1 o atraso é de 10 períodos, e assim por diante. Para uma dada idade média (isto é, a quantidade de atraso), a previsão de suavização exponencial simples (SES) é um pouco superior à previsão de média móvel simples (SMA) porque coloca relativamente mais peso na observação mais recente - i. e. É ligeiramente mais quotresponsivequot às mudanças que ocorrem no passado recente. Por exemplo, um modelo SMA com 9 termos e um modelo SES com 945 0,2 têm uma idade média de 5 para os dados nas suas previsões, mas o modelo SES coloca mais peso nos últimos 3 valores do que o modelo SMA e no modelo SMA. Uma outra vantagem importante do modelo SES sobre o modelo SMA é que o modelo SES usa um parâmetro de suavização que é continuamente variável, de modo que pode ser facilmente otimizado Usando um algoritmo quotsolverquot para minimizar o erro quadrático médio. O valor óptimo de 945 no modelo SES para esta série revela-se 0.2961, como mostrado aqui: A idade média dos dados nesta previsão é de 1 / 0.2961 3.4 períodos, que é semelhante ao de um 6-termo simples de movimento média. As previsões a longo prazo do modelo SES são uma linha reta horizontal. Como no modelo SMA eo modelo de caminhada aleatória sem crescimento. No entanto, note que os intervalos de confiança calculados por Statgraphics agora divergem de uma forma razoavelmente aparente, e que eles são substancialmente mais estreitos do que os intervalos de confiança para o modelo de caminhada aleatória. O modelo SES assume que a série é um tanto mais previsível do que o modelo de caminhada aleatória. Um modelo SES é realmente um caso especial de um modelo ARIMA. De modo que a teoria estatística dos modelos ARIMA fornece uma base sólida para o cálculo de intervalos de confiança para o modelo SES. Em particular, um modelo SES é um modelo ARIMA com uma diferença não sazonal, um termo MA (1) e nenhum termo constante. Também conhecido como um modelo quimétrico ARIMA (0,1,1) sem constantequot. O coeficiente MA (1) no modelo ARIMA corresponde à quantidade 1-945 no modelo SES. Por exemplo, se você ajustar um modelo ARIMA (0,1,1) sem constante à série aqui analisada, o coeficiente MA estimado (1) resulta ser 0,7029, que é quase exatamente um menos 0,2961. É possível adicionar a hipótese de uma tendência linear constante não-zero para um modelo SES. Para isso, basta especificar um modelo ARIMA com uma diferença não sazonal e um termo MA (1) com uma constante, ou seja, um modelo ARIMA (0,1,1) com constante. As previsões a longo prazo terão então uma tendência que é igual à tendência média observada ao longo de todo o período de estimação. Você não pode fazer isso em conjunto com o ajuste sazonal, porque as opções de ajuste sazonal são desativadas quando o tipo de modelo é definido como ARIMA. No entanto, você pode adicionar uma tendência exponencial de longo prazo constante a um modelo de suavização exponencial simples (com ou sem ajuste sazonal) usando a opção de ajuste de inflação no procedimento de Previsão. A taxa adequada de inflação (crescimento percentual) por período pode ser estimada como o coeficiente de declive num modelo de tendência linear ajustado aos dados em conjunto com uma transformação de logaritmo natural, ou pode basear-se em outra informação independente sobre as perspectivas de crescimento a longo prazo . (Retornar ao início da página.) Browns Linear (ie double) Suavização exponencial Os modelos SMA e SES assumem que não há tendência de qualquer tipo nos dados (o que geralmente é OK ou pelo menos não muito ruim para 1- Antecipadamente quando os dados são relativamente ruidosos) e podem ser modificados para incorporar uma tendência linear constante como mostrado acima. O que acontece com as tendências a curto prazo Se uma série exibe uma taxa variável de crescimento ou um padrão cíclico que se destaque claramente contra o ruído, e se houver uma necessidade de prever mais de um período à frente, a estimativa de uma tendência local também pode ser um problema. O modelo de suavização exponencial simples pode ser generalizado para obter um modelo de suavização exponencial linear (LES) que calcula estimativas locais de nível e tendência. O modelo de tendência de variação de tempo mais simples é o modelo de alisamento exponencial linear de Browns, que usa duas séries suavizadas diferentes que são centradas em diferentes pontos no tempo. A fórmula de previsão é baseada em uma extrapolação de uma linha através dos dois centros. (Uma versão mais sofisticada deste modelo, Holt8217s, é discutida abaixo.) A forma algébrica do modelo de suavização exponencial linear de Brown8217s, como a do modelo de suavização exponencial simples, pode ser expressa em um número de formas diferentes mas equivalentes. A forma quotstandard deste modelo é usualmente expressa da seguinte maneira: Seja S a série de suavização simples obtida pela aplicação de suavização exponencial simples à série Y. Ou seja, o valor de S no período t é dado por: (Lembre-se que, sob simples Exponencial, esta seria a previsão para Y no período t1.) Então deixe Squot denotar a série duplamente-alisada obtida aplicando a suavização exponencial simples (usando o mesmo 945) à série S: Finalmente, a previsão para Y tk. Para qualquer kgt1, é dada por: Isto produz e 1 0 (isto é, enganar um pouco e deixar a primeira previsão igual à primeira observação real) e e 2 Y 2 8211 Y 1. Após o que as previsões são geradas usando a equação acima. Isto produz os mesmos valores ajustados que a fórmula baseada em S e S se estes últimos foram iniciados utilizando S 1 S 1 Y 1. Esta versão do modelo é usada na próxima página que ilustra uma combinação de suavização exponencial com ajuste sazonal. Holt8217s Linear Exponential Smoothing Brown8217s O modelo LES calcula estimativas locais de nível e tendência ao suavizar os dados recentes, mas o fato de que ele faz isso com um único parâmetro de suavização coloca uma restrição nos padrões de dados que é capaz de ajustar: o nível ea tendência Não são permitidos variar em taxas independentes. Holt8217s modelo LES aborda esta questão, incluindo duas constantes de alisamento, um para o nível e um para a tendência. Em qualquer momento t, como no modelo Brown8217s, existe uma estimativa L t do nível local e uma estimativa T t da tendência local. Aqui eles são calculados recursivamente a partir do valor de Y observado no tempo t e as estimativas anteriores do nível e tendência por duas equações que aplicam alisamento exponencial para eles separadamente. Se o nível estimado ea tendência no tempo t-1 são L t82091 e T t-1. Respectivamente, então a previsão para Y tshy que teria sido feita no tempo t-1 é igual a L t-1 T t-1. Quando o valor real é observado, a estimativa atualizada do nível é computada recursivamente pela interpolação entre Y tshy e sua previsão, L t-1 T t-1, usando pesos de 945 e 1-945. A mudança no nível estimado, Nomeadamente L t 8209 L t82091. Pode ser interpretado como uma medida ruidosa da tendência no tempo t. A estimativa actualizada da tendência é então calculada recursivamente pela interpolação entre L t 8209 L t82091 e a estimativa anterior da tendência, T t-1. Usando pesos de 946 e 1-946: A interpretação da constante de suavização de tendência 946 é análoga à da constante de alisamento de nível 945. Modelos com valores pequenos de 946 assumem que a tendência muda apenas muito lentamente ao longo do tempo, enquanto modelos com Maior 946 supor que está mudando mais rapidamente. Um modelo com um 946 grande acredita que o futuro distante é muito incerto, porque os erros na tendência-estimativa tornam-se completamente importantes ao prever mais de um período adiante. As constantes de suavização 945 e 946 podem ser estimadas da maneira usual, minimizando o erro quadrático médio das previsões de 1 passo à frente. Quando isso é feito em Statgraphics, as estimativas se tornam 945 0,3048 e 946 0,008. O valor muito pequeno de 946 significa que o modelo assume muito pouca mudança na tendência de um período para o outro, então basicamente este modelo está tentando estimar uma tendência de longo prazo. Por analogia com a noção de idade média dos dados que é usada na estimativa do nível local da série, a idade média dos dados que é usada na estimativa da tendência local é proporcional a 1/946, embora não exatamente igual a isto. Neste caso, isto é 1 / 0.006 125. Este número é muito preciso, na medida em que a precisão da estimativa de 946 é realmente de 3 casas decimais, mas é da mesma ordem geral de magnitude que o tamanho da amostra de 100 , Assim que este modelo está calculando a média sobre bastante muita história em estimar a tendência. O gráfico de previsão abaixo mostra que o modelo LES estima uma tendência local ligeiramente maior no final da série do que a tendência constante estimada no modelo SEStrend. Além disso, o valor estimado de 945 é quase idêntico ao obtido pelo ajuste do modelo SES com ou sem tendência, de modo que este é quase o mesmo modelo. Agora, eles parecem previsões razoáveis ​​para um modelo que é suposto estar estimando uma tendência local Se você 8220eyeball8221 esse enredo, parece que a tendência local virou para baixo no final da série O que aconteceu Os parâmetros deste modelo Foram estimados minimizando o erro quadrático das previsões de um passo à frente, e não as previsões a mais longo prazo, caso em que a tendência não faz muita diferença. Se tudo o que você está olhando são 1-passo-frente erros, você não está vendo a imagem maior de tendências sobre (digamos) 10 ou 20 períodos. A fim de obter este modelo mais em sintonia com a nossa extrapolação do globo ocular dos dados, podemos ajustar manualmente a tendência de suavização constante para que ele usa uma linha de base mais curto para a estimativa de tendência. Por exemplo, se escolhemos definir 946 0,1, então a idade média dos dados usados ​​na estimativa da tendência local é de 10 períodos, o que significa que estamos fazendo uma média da tendência ao longo dos últimos 20 períodos aproximadamente. Here8217s o que o lote de previsão parece se ajustarmos 946 0.1 mantendo 945 0.3. Isso parece intuitivamente razoável para esta série, embora seja provavelmente perigoso para extrapolar esta tendência mais de 10 períodos no futuro. E sobre as estatísticas de erro Aqui está uma comparação de modelos para os dois modelos mostrados acima, bem como três modelos SES. O valor ótimo de 945 para o modelo SES é de aproximadamente 0,3, mas resultados semelhantes (com ligeiramente mais ou menos responsividade, respectivamente) são obtidos com 0,5 e 0,2. (A) Holts linear exp. Alisamento com alfa 0,3048 e beta 0,008 (B) Holts linear exp. Alisamento com alfa 0,3 e beta 0,1 (C) Alisamento exponencial simples com alfa 0,5 (D) Alisamento exponencial simples com alfa 0,3 (E) Alisamento exponencial simples com alfa 0,2 Suas estatísticas são quase idênticas, então realmente não podemos fazer a escolha com base De erros de previsão de 1 passo à frente dentro da amostra de dados. Temos de recorrer a outras considerações. Se acreditarmos firmemente que faz sentido basear a estimativa de tendência atual sobre o que aconteceu nos últimos 20 períodos, podemos fazer um caso para o modelo LES com 945 0,3 e 946 0,1. Se quisermos ser agnósticos quanto à existência de uma tendência local, então um dos modelos SES pode ser mais fácil de explicar e também fornecerá mais previsões de médio-caminho para os próximos 5 ou 10 períodos. Evidências empíricas sugerem que, se os dados já tiverem sido ajustados (se necessário) para a inflação, então pode ser imprudente extrapolar os resultados lineares de curto prazo Muito para o futuro. As tendências evidentes hoje podem afrouxar no futuro devido às causas variadas tais como a obsolescência do produto, a competição aumentada, e os abrandamentos cíclicos ou as ascensões em uma indústria. Por esta razão, a suavização exponencial simples geralmente desempenha melhor fora da amostra do que poderia ser esperado, apesar da sua extrapolação de tendência horizontal quotnaivequot. Modificações de tendência amortecida do modelo de suavização exponencial linear também são freqüentemente usadas na prática para introduzir uma nota de conservadorismo em suas projeções de tendência. O modelo LES com tendência a amortecimento pode ser implementado como um caso especial de um modelo ARIMA, em particular, um modelo ARIMA (1,1,2). É possível calcular intervalos de confiança em torno de previsões de longo prazo produzidas por modelos exponenciais de suavização, considerando-os como casos especiais de modelos ARIMA. A largura dos intervalos de confiança depende de (i) o erro RMS do modelo, (ii) o tipo de suavização (simples ou linear) (iii) o valor (S) da (s) constante (s) de suavização e (iv) o número de períodos que você está prevendo. Em geral, os intervalos se espalham mais rapidamente à medida que o 945 se torna maior no modelo SES e eles se espalham muito mais rápido quando se usa linear ao invés de alisamento simples. Este tópico é discutido mais adiante na seção de modelos ARIMA das notas. (Retornar ao início da página.) Regressão linear ponderada exponencialmente Oi tudo, Feliz Ano Novo Existe uma função para regressão linear exponencialmente ponderada em R Geralmente, uma regressão linear está em um tronco de dados. E se eu executar uma regressão linear em séries temporais, dividiria a série de tempo em janelas quotoverlapped / rollingquot e executaria uma regressão linear em cada pedaço de dados. Existe uma maneira de transformar a regressão linear de rolamento em toda a série temporal em uma ponderada exponencialmente, isto é, usando um fator de decaimento lambda para dar mais pesos às observações mais recentes. Existem pacotes em R que pode fazer essa alternativa versão HTML excluído mailing list escondido e-mail stat. ethz. ch/mailman/listinfo/r-sig-finance - assinante-postagem apenas. Se você quer postar, inscreva-se primeiro. - Observe também que esta não é a lista de r-ajuda onde as perguntas R gerais devem ir. Open this post in threaded view Conteúdo do Relatório como Inadequado Re: regressão linear exponencialmente ponderada R tem muitas funções para suavização exponencial. Etsltrgm2.lab. nig. ac. jp/RGM2/funcrdidforecast:forecast. ets gt na previsão packageltcran. r-project. org/web/packages/forecast/index gt é particularmente útil. Além disso, muitos modelos em R (incluindo lm e glm) têm um argumento de pesos. Você pode chegar a qualquer esquema de ponderação que você deseja, e passá-lo para o seu modelo como um argumento de pesos. Gt gt gt gt Existe uma função para a regressão linear exponencialmente ponderada em R gt gt Geralmente, uma regressão linear está em um tronco De dados. Gt gt E se eu executar regressão linear em séries temporais, eu dividir a série de tempo gt em janelas quotoverlapped / rollingquot e executar regressão linear em cada rolando gt pedaço de dados. Gt gt Existe uma maneira de transformar a regressão linear de rolamento em todo o tempo gt série em um exponencialmente ponderada, ou seja, usando um fator de decaimento lambda gt para dar mais pesos para as observações mais recentes. Gt gt Há pacotes em R que pode fazer que gt gt Obrigado gt gt gt alternativa versão gt gt gt gt ocultos email mailing list gt stat. ethz. ch/mailman/listinfo/r-sig-finance gt - Assinante - Postagem apenas. Se você quer postar, inscreva-se primeiro. Gt - Observe também que esta não é a lista de r-help onde as perguntas R gerais gt devem ir. Gt alternativa versão HTML excluído e-mail escondido lista de e-mails stat. ethz. ch/mailman/listinfo/r-sig-finance - Subscriber-postagem apenas. Se você quer postar, inscreva-se primeiro. - Observe também que esta não é a lista de r-ajuda onde as perguntas R gerais devem ir. O que eu estou procurando é algum tipo de quoteexponential media linear de regressão linear. Em uma regressão linear típica, dividimos as séries temporais em troncos. Por exemplo, executamos Regressão Linear nos seguintes troncos de dados de séries temporais (tamanho de janela K): Você está dizendo que eu posso usar a regressão linear ponderada exponencialmente na série de tempo à medida que os dados se tornam disponíveis Então cada vez o que deveria ser meu citado exponencialmente decadente Weights Obrigado Muito On Thu, 5 de janeiro de 2012 às 9:22, Zachary Mayer lthidden e-mail gt escreveu: gt Im não seguindo você. O que você quer dizer com a quota dividida tronco de dados Como gt tanto quanto eu sei, lm e glm vai ter tantos dados como você dar-lhes, até gt você ficar sem memória. Por que não executar o lm em toda a série de tempo gt gt Talvez você poderia postar um exemplo reproduzível, para que possamos ver o que você está tentando fazer. Gt gt gt On Thu, 5 de janeiro de 2012 às 10:16, Michael lthidden e-mail gt escreveu: gt gtgt gtgt Obrigado Zach. Gtgt gtgt O problema com essas funções (por exemplo, lm ou glm com o argumento de pesos) gtgt é que eles ainda fazem isso em um tronco dividido de dados. Isto é, bloco por bloco, e não toda a série temporal. Gtgt gtgt Se pensarmos sobre a estimativa da média móvel exponencial da volatilidade gtgt com um fator de decaimento lamda, é na verdade toda a série temporal. Não gtgt dividido tronco de dados. Gtgt gtgtgt gtgtgt Oi Michael, gtgtgt gtgtgt R tem muitas funções para suavização exponencial. Etsltrgm2.lab. nig. ac. jp/RGM2/funcrdidforecast:forecast. ets gt em gtgtgt a previsão packageltcran. r-project. org/web/packages/forecast/index gt é gtgtgt particularmente útil. Além disso, muitos modelos em R (incluindo lm e glm) gtgtgt têm um argumento de pesos. Você pode vir acima com qualquer esquema de ponderação que deseja gtgtgt, e passá-lo para o seu modelo como um argumento de pesos. Gtgtgt gtgtgt Pode haver referências mais úteis na tarefa de cronograma da série CRAN viewltcran. r-project. org/web/views/TimeSeries gt gtgtgt. Gtgtgt gtgtgt Registrado em: quinta-feira, 5 de janeiro de 2012 às 9:30 AM, Michael lthidden e-mail gt escreveu: gtgtgt gtgtgtgt Oi tudo, Feliz Ano Novo gtgtgtgt gtgtgtgt Existe uma função para exponencialmente ponderada regressão linear em R gtgtgtgt Gtgtgtgt Geralmente, uma regressão linear está em um tronco de dados. Gtgtgtgt gtgtgtgt E se eu executar regressão linear em séries temporais, divido a série de tempo gtgtgtgt em janelas quotoverlapped / rollingquot e executar regressão linear em cada gtgtgtgt rolando gtgtgtgt pedaço de dados. Gtgtgtgt gtgtgtgt Existe uma maneira de transformar a regressão linear de rolamento em todo o tempo gtgtgtgt série em um exponencialmente ponderada, ou seja, usando um fator de decaimento gtgtgtgt lambda gtgtgtgt para dar mais pesos para as observações mais recentes. Gtgtgtgt gtgtgtgt Existem pacotes em R que pode fazer que gtgtgtgt gtgtgtgt Obrigado muito gtgtgtgt gtgtgtgt alternativa versão HTML gtgtgtgt gtgtgtgt gtgtgtgt ocultos e-mail mailing list gtgtgtgt stat. ethz. ch/mailman/listinfo/r-sig-finance gtgtgtgt - Assinante - Postagem apenas. Se você quer postar, inscreva-se primeiro. Gtgtgtgt - Note também que esta não é a lista de r-help onde as perguntas R gerais gtgtgtgt devem ir. Gtgtgt gtgtgt gtgtgt gtgt gt alternativa versão HTML excluído mailing list escondido e-mail stat. ethz. ch/mailman/listinfo/r-sig-finance - Assinante-postagem apenas. Se você quer postar, inscreva-se primeiro. - Observe também que esta não é a lista de r-ajuda onde as perguntas R gerais devem ir. Em resposta a este post por Zachary Mayer eu acho que você deve usar um modelo variável de tempo variável (olhar para o pacote dlm) ou se você não tem tempo para aprender tentar suavizar os preditores em primeiro lugar, em seguida, executar a janela de rotação regressão talvez robustified. Se você usar o filtro de Kalman use um AR (1) para o parâmetro na equação de estado como yt bt Xt-1 bt c bt-1 c fará o alisamento (é o seu (1-lambda)) Do meu ponto de vista Não há solução barata e suja para este problema. Da: Zachary Mayer lthidden e-mail gt A: Michael lthidden e-mail gt C: r-sig-finance lthidden e-mail gt Inviato: Gioved 5 Gennaio 2012 15:22 R-SIG-Finanças exponencialmente ponderada regressão linear Im não seguindo você. O que você quer dizer com o tronco dividido por quotas de dados? Até onde eu sei, lm e glm terão tantos dados quanto você lhes der, até que você fique sem memória. Por que não executar o lm em toda a série de tempo Talvez você poderia postar um exemplo reproduzível, para que possamos ver o que você está tentando fazer. On Thu, 5 de janeiro de 2012 às 10:16, Michael lthidden e-mail gt escreveu: gt gt Obrigado Zach. Gt gt O problema com essas funções (por exemplo, lm ou glm com o argumento de pesos) é gt que eles ainda fazê-lo em um tronco dividido de dados. Isto é, bloco por bloco, gt não toda a série temporal. Gt gt Se pensarmos sobre a estimativa da média móvel exponencial da volatilidade gt com um fator de decaimento lamda, é na verdade toda a série temporal. Não gt dividido tronco de dados. Gt Todos os pensamentos gt gt Oi, 5 de janeiro de 2012 às 8:40, Zachary Mayer lthidden e-mail gtwrote: gt gtgt Oi Michael, gtgt gtgt R tem muitas funções para suavização exponencial. Etsltrgm2.lab. nig. ac. jp/RGM2/funcrdidforecast:forecast. ets gt em gtgt a previsão packageltcran. r-project. org/web/packages/forecast/index gt é particularmente útil gtgt. Além disso, muitos modelos em R (incluindo lm e glm) gtgt têm um argumento de pesos. Você pode vir acima com qualquer esquema de ponderação que deseja gtgt, e passá-lo para o seu modelo como um argumento de pesos. Gtgt gtgt Pode haver referências mais úteis na tarefa de cronograma da série CRAN viewltcran. r-project. org/web/views/TimeSeries gt gtgt. Gtgt gtgt gtgt gtgt gtgt gtgt gtgt gtgt gtgt gtgt gtgt gtgt gtgt gtgt gtgt gtgt gtgt gtgt gtgt gtgt gtgtgt gtgtgt Existe uma função para regressão linear exponencialmente ponderada em R gtgtgt gtgtgt Geralmente, um Regressão linear está em um tronco de dados. Gtgtgt gtgtgt E se eu executar regressão linear em séries temporais, eu dividir a série de tempo gtgtgt em quotoverlapped / rollingquot janelas e executar regressão linear em cada gtgtgt rolling gtgtgt pedaço de dados. Gtgtgt gtgtgt Existe uma maneira de transformar a regressão linear de rolamento em todo o tempo gtgtgt série em um exponencialmente ponderada, ou seja, usando um fator de decaimento gtgtgt lambda gtgtgt para dar mais pesos para as observações mais recentes. Gtgtgt gtgtgt Há pacotes em R que pode fazer isso gtgtgt gtgtgt Obrigado muito gtgtgt gtgtgt alternativa versão HTML gtgtgt gtgtgt gtgtgt gtgtgt ocultos e-mail lista de discussão gtgtgt stat. ethz. ch/mailman/listinfo/r-sig-finance gtgtgt - Assinante - Postagem apenas. Se você quer postar, inscreva-se primeiro. Gtgtgt - Note também que esta não é a lista de r-help onde as perguntas R gerais gtgtgt devem ir. Gtgtgt gtgt gtgt gt alternativa versão HTML excluído e-mail escondido lista de e-mails stat. ethz. ch/mailman/listinfo/r-sig-finance - Assinante-postagem apenas. Se você quer postar, inscreva-se primeiro. - Observe também que esta não é a lista de r-ajuda onde as perguntas R gerais devem ir. Versão alternativa HTML excluído e-mail escondido lista de e-mails stat. ethz. ch/mailman/listinfo/r-sig-finance - Subscriber-postagem apenas. Se você quer postar, inscreva-se primeiro. - Observe também que esta não é a lista de r-ajuda onde as perguntas R gerais devem ir. Em resposta a este post por LosemindL Você executar o lm em todos os dados disponíveis em cada etapa. Você tem que recalcular os pesos para toda a série de tempo em cada etapa. Cabe a você para chegar a um esquema de ponderação que faz sentido para você. Escolha um fator de decaimento (0,1, chamá-lo de lambda) Seu esquema de ponderação é lambda (nt), onde n é o comprimento de sua série e t é o número de observação. Se você tivesse uma série de tempo com 100 pontos, O peso seria lambda100 e o último peso seria lambda 1. Valores mais baixos de lambda lugar mais peso em observações recentes Em Thu, 5 de janeiro de 2012 às 10:40, Michael lthidden e-mail gt escreveu: gt gt gt Aqui está um exemplo A partir deste link: gt gt gt stats. stackexchange / questions / 9931 / exponencialmente ponderada-movendo-linear-regressão gt gt Eu não estou certo de que esta é a melhor solução. gt gt Se você pensa da média móvel exponencial de volatilidade Metrics gt standard), que é mais elegante). Gt gt Rgt x lt - 1:10 média deste valor é 5,5 gt Rgt lm (x 1) regressão em valores constantes significa gt gt Chamada: gt lm (fórmula x 1, pesos0,9 (seq (10,1, by-1 ) Gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt 5, 2012 em 9:37, Michael lthidden e-mail gt escreveu: gt gtgt O que eu estou procurando é algum tipo de quotexponential mover média linear gtgt regressionquot. Gtgt gtgt Em uma regressão linear típica, dividimos as séries de tempo em troncos. Gtgt gtgt Por exemplo, executamos Linear Regression nos seguintes troncos de tempo gtgt série dados (janela tamanho K): gtgt gtgt 1. K, gtgt 2. (K1), gtgt 3. (K2), gtgt. Gtgt. Gtgt (N-K1). N gtgt ---------------- gtgt gtgt Você está dizendo que eu posso usar a regressão linear gtgt exponencialmente ponderada sobre as séries temporais à medida que os dados se tornam disponíveis gtgt gtgt 1. K, gtgt 1. (K1), gtgt 1. (K2), gtgt 1. (K3), gtgt. Gtgt. Gtgt 1. N gtgt gtgt Então, cada vez que deve ser o meu quotexponentially decayingquot pesos gtgt gtgt ---------------- gtgt gtgt Obrigado gtgt muito Em Thu, 05 de janeiro de 2012 às 9: 22 AM, Zachary Mayer e-mail lthidden gtwrote: gtgt gtgtgt Im não seguindo você. O que você quer dizer com a quota dividida tronco de dados gtgtgt Tanto quanto eu sei, lm e glm vai ter tanto dados como você dar-lhes, gtgtgt até que você ficar sem memória. Por que não executar o lm em toda a série de tempo gtgtgt gtgtgt Talvez você poderia postar um exemplo reproduzível, para que possamos ver o que você está tentando gtgtgt fazer. Gtgtgt gtgtgt gtgtgt On Thu, Jan 5, 2012 em 10:16, Michael lthidden e-mail gt escreveu: gtgtgt gtgtgtgt gtgtgtgt Obrigado Zach. Gtgtgtgt gtgtgtgt O problema com essas funções (por exemplo, lm ou glm com o argumento de pesos) gtgtgtgt é que eles ainda fazem isso em um tronco dividido de dados. Isto é, bloco por bloco, mas não toda a série cronológica. Gtgtgtgt gtgtgtgt Se pensarmos sobre a estimativa da média móvel exponencial da volatilidade gtgtgtgt com um fator de decaimento lamda, é na verdade toda a série temporal. Não gtgtgtgt dividido tronco de dados. Gtgtgtgt gtgtgtgt gtgtgtgt gtgtgtgt gtgtgtgt Oi, Michael, gtgtgtgtgt gtgtgtgt Rt tem muitas funções para suavização exponencial. Etsltrgm2.lab. nig. ac. jp/RGM2/funcrdidforecast:forecast. ets gt em gtgtgtgtgt a previsão packageltcran. r-project. org/web/packages/forecast/index gt é gtgtgtgtgt particularmente útil. Além disso, muitos modelos em R (incluindo lm e glm) gtgtgtgtgt têm um argumento de pesos. Você pode chegar a qualquer esquema de ponderação que você deseja, e passá-lo para o seu modelo como um argumento de pesos. Gtgtgtgtgt gtgtgtgtgt Pode haver referências mais úteis na tarefa cron cronológica viewltcran. r-project. org/web/views/TimeSeries gt gtgtgtgtgt. gtgtgtgtgt Saudações gtgtgtgtgt, gtgtgtgtgt gtgtgtgtgt Zach gtgtgtgtgt gtgtgtgtgt On Thu, 05 de janeiro de 2012 às 9:30 AM, Michael lthidden email gtwrote: gtgtgtgtgt gtgtgtgtgtgt Oi todos, Feliz Ano Novo gtgtgtgtgtgt gtgtgtgtgtgt Existe uma função de regressão linear exponencialmente ponderada em R gtgtgtgtgtgt gtgtgtgtgtgt Geralmente, uma regressão linear está em um tronco de dados. Gtgtgtgtgtgt gtgtgtgtgtgt E se eu executar regressão linear em séries temporais, divido o tempo gtgtgtgtgtgt série gtgtgtgtgtgt em quotoverlapped / rollingquot janelas e executar regressão linear em cada gtgtgtgtgtgtgtgt rolando gtgtgtgtgtgt pedaço de dados. Gtgtgtgtgtgt gtgtgtgtgtgt Existe uma maneira de transformar a regressão linear de rolamento em todo o tempo gtgtgtgtgtgt série em um exponencialmente ponderada, ou seja, usando um factor de decaimento gtgtgtgtgtgt lambda gtgtgtgtgtgt para dar mais pesos para as observações mais recentes. gtgtgtgtgtgt gtgtgtgtgtgt Existem pacotes em R que pode fazer isso gtgtgtgtgtgt gtgtgtgtgtgt obrigado gtgtgtgtgtgt muito gtgtgtgtgtgt alternativa HTML versão excluído gtgtgtgtgtgt gtgtgtgtgtgt gtgtgtgtgtgt escondido correio electrónico lista gtgtgtgtgtgt stat. ethz. ch/mailman/listinfo/r-sig-finance gtgtgtgtgtgt - Subscriber - Postagem apenas. Se você quer postar, inscreva-se primeiro. Gtgtgtgtgtgt - Observe também que esta não é a lista de r-help onde as perguntas de Rtgtgtgtgtgt gerais devem ir. Gtgtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgt gtgtgt gtgt gt alternativa versão HTML excluída lista de discussão oculta do e-mail stat. ethz. ch/mailman/listinfo/r-sig-finance - Assinante-postagem apenas. Se você quer postar, inscreva-se primeiro. - Observe também que esta não é a lista de r-ajuda onde as perguntas R gerais devem ir. Em resposta a este post por riccardo visca Ok, há um pacote de filtro Kalma em R. Mas eu não tenho certeza yt bt Xt-1 bt c bt-1 é o filtro de Kalman On Thu, 5 de janeiro de 2012 às 9:44, Eu acho que você deve usar um modelo variável de tempo variável (olhar para dlm gt pacote) ou se você não tem tempo para aprender tentar suavizar os preditores gt primeiro, em seguida, executar a regressão de janela rolando talvez robustified. Gt gt Se você usar o filtro de Kalman use um AR (1) para o parâmetro no estado gt equação como gt gt yt bt Xt-1 gt bt c bt-1 gt gt c fará o alisamento (é o seu (1- Lambda)) gt gt Do meu ponto de vista, não há solução barata e suja para este problema. Gt gt gt gt ------------------------------ gt Da: Zachary Mayer e-mail lthidden gt gt A: e-mail Michael lthidden gt gt Re: R-SIG-Finanças exponencialmente ponderada regressão linear gt gt Im não seguindo você. C: r-sig-finance lthidden email gt gt O que você quer dizer com a quota dividida tronco de dados Como gt tanto quanto eu sei, lm e glm vai ter tantos dados como você dar-lhes, até gt você ficar sem memória. Por que não executar o lm em toda a série de tempo gt gt Talvez você poderia postar um exemplo reproduzível, para que possamos ver o que você está tentando fazer. Gt gt Em Thu, 5 de janeiro de 2012 às 10:16, Michael lthidden e-mail gt escreveu: gt gt gt gt gt Obrigado Zach. Gt gt gt gt O problema com essas funções (por exemplo, lm ou glm com argumento de pesos) gt é gt gt que eles ainda fazê-lo em um tronco dividido de dados. Isto é, bloco por bloco, gt gt não toda a série temporal. Gt gt gt gt Se pensarmos sobre a estimativa da média móvel exponencial de volatilidade gt gt com um fator de decaimento lamda, é na verdade toda a série temporal. Não gt gt dividido tronco de dados. Gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt Oi Michael, gt gtgt gt gtgt R tem muitas funções para suavização exponencial. Etslt gt rgm2.lab. nig. ac. jp/RGM2/funcrdidforecast:forecast. ets gt em gt gtgt a previsão packagelt gt cran. r-project. org/web/packages/forecast/index gt é gt gt gtgt particularmente útil. Além disso, muitos modelos em R (incluindo lm e gt glm) gt gtgt têm um argumento de pesos. Você pode vir acima com qualquer esquema de ponderação que deseja gtgt, e passá-lo para o seu modelo como um argumento de pesos. Gt gtgt gt gtgt Pode haver referências mais úteis sobre a cran. r-project. org/web/views/TimeSeries gt gt gtgt. Gt gtgt gt gtgt Registrado em: quinta-feira, 5 de janeiro de 2012 às 9:30, Michael lthidden e-mail gt escreveu: gt gtgt gt gtgtgt Oi pessoal, Feliz Ano Novo gt gtgtgt gt gtgtgt Existe Uma função para a regressão linear exponencialmente ponderada em R gt gtgtgt gt gtgtgt Geralmente, uma regressão linear está em um tronco de dados. Gt gtgtgt gt gtgtgt E se eu executar a regressão linear em séries temporais, eu dividir a série de tempo gt gtgtgt em quotoverlapped / rollingquot janelas e executar regressão linear em cada gt gtgtgt rolando gt gtgtgt pedaço de dados. Gt gtgtgt gt gtgtgt Existe uma maneira de transformar a regressão linear de rolamento em todo o tempo gt gtgtgt série em um exponencialmente ponderada, ou seja, usando um fator de decaimento gt gtgtgt lambda gt gtgtgt para dar mais pesos para as observações mais recentes. Gt gtgtgt gt gtgtgt Há pacotes em R que pode fazer que gt gtgtgt gt gtgtgt Obrigado gt gtgtgt gt gtgtgt alternativa versão HTML gt gtgtgt gt gtgtgt gt gtgtgt gt gtgtgt gt gtgtgt lista de e-mail escondida gt gtgtgt stat. ethz. ch/mailman/listinfo/ R-sig-finance gt gtgtgt - Assinante-postagem apenas. Se você quer postar, inscreva-se primeiro. Gt gtgtgt - Note também que esta não é a lista de r-help onde as perguntas R gerais gt gtgtgt devem ir. Gt gtgtgt gt gtgt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt - Se você quer postar, inscreva-se primeiro. Gt - Observe também que esta não é a lista de r-help onde as perguntas R gerais gt devem ir. Gt gt gt alternativo versão HTML excluído mailing list escondido e-mail stat. ethz. ch/mailman/listinfo/r-sig-finance - Assinante-postagem apenas. Se você quer postar, inscreva-se primeiro. - Observe também que esta não é a lista de r-ajuda onde as perguntas R gerais devem ir. Re: exponencialmente ponderada regressão linear Em resposta a este post por riccardo visca Parece que isso pode ser facilmente resolvido usando rollApply ou period. apply e lm com pesos exponencialmente decrescente (na opção w) . BTW, a regressão em dados exponencialmente ponderados é muitas vezes chamado de mínimos quadrados quotdounted e é o que eu chamaria de um filtro de kalman homem mans quotpoor. De fato, houve alguns trabalhos na literatura de engenharia que mostram que os mínimos quadrados com desconto são equivalentes a um certo tipo de filtro estimado a partir de um modelo de regressão espacial de estados com parâmetros variáveis ​​no tempo. Eu usei menos quadrados com desconto para modelagem de dados de fundos de hedge e achei que funcionasse muito bem. Além disso, o modelo variável de espaço de estados pode funcionar bem com algumas variáveis ​​explicativas (1 ou 2), mas muitas vezes não funciona bem se houver muitos (digamos, 5 preditores). Para cada parâmetro de regressão, é necessário estimar um parâmetro de suavização AR (1) mais um termo de erro de equação de transição. Com muitos preditores, você enfrenta problemas de estabilidade numérica muito rapidamente ea função de verossimilhança pode ter muitos mínimos locais. Por esta razão, os mínimos quadrados descontados são uma alternativa atraente. Finalmente, é muito difícil fazer a seleção do modelo com o filtro de kalman do espaço de estado. Como você escolhe as variáveis ​​para entrar na equação de regressão Eu não vi ninguém fazer um estudo sistemático de seleção de modelo em modelos variáveis ​​de tempo variável. Talvez, este seja o lugar onde uma aproximação Bayesian pôde ser útil. Este é um tópico importante mas negligenciado. Eu ficaria feliz se alguém me apontou para algumas pesquisas sobre este tema. Eric Zivot Robert Richards Professor Adjunto de Economia e Diretor de Outreach Professor Adjunto de Finanças Professor Adjunto de Estatística Professor Adjunto de Matemática Aplicada Departamento de Economia Caixa 353330 e-mail: e-mail escondido Universidade de Washington telefone: 206-543-6715 Seattle, WA 98195-3330 Www: faculty. washington. edu/ezivot ----- Mensagem Original ----- De: email escondido mailto: email escondido Em Nome De riccardo visca Enviado: quinta-feira, 05 de janeiro de 2012 07:44 Para: Zachary Mayer Eu acho que você deve usar um modelo de parâmetro de variação de tempo (olhar para o pacote dlm) ou se você não tem tempo para aprender, tente suavizar a regressão linear ponderada exponencialmente R-SIG-Finance Preditores primeiro, em seguida, executar a janela de rotação regressão talvez robustified. Se você usar o filtro de Kalman use um AR (1) para o parâmetro na equação de estado como yt bt Xt-1 bt c bt-1 c fará o alisamento (é o seu (1-lambda)) gtFrom meu ponto de vista Não há nenhuma solução barata e suja para este problema. Da: Zachary Mayer lthidden e-mail gt A: Michael lthidden e-mail gt C: r-sig-finance lthidden e-mail gt Inviato: Giovedl 5 Gennaio 2012 15:22 R-SIG-Finance exponencialmente ponderada regressão linear Im não seguindo você. O que você quer dizer com o tronco dividido por quotas de dados? Até onde eu sei, lm e glm terão tantos dados quanto você lhes der, até que você fique sem memória. Por que não executar o lm em toda a série de tempo Talvez você poderia postar um exemplo reproduzível, para que possamos ver o que você está tentando fazer. On Thu, 5 de janeiro de 2012 às 10:16, Michael lthidden e-mail gt escreveu: gt gt Obrigado Zach. Gt gt O problema com estas funções (por exemplo, lm ou glm com pesos gt argumento) é que eles ainda fazê-lo em um tronco dividido de dados. Isto é gt bloco por bloco, não toda a série temporal. Gt gt Se pensarmos sobre a média móvel exponencial da volatilidade gt com um fator de decaimento lamda, é na verdade, em todo o tempo gt série. Não dividido tronco de dados. Gt Todos os pensamentos gt gt Oi, 5 de janeiro de 2012 às 8:40, Zachary Mayer lthidden e-mail gtwrote: gt gtgt Oi Michael, gtgt gtgt R tem muitas funções para suavização exponencial. Gtgt etsltrgm2.lab. nig. ac. jp/RGM2/funcrdidforecast:forecast. e gtgt tsgt na previsão gtgt packageltcran. r-project. org/web/packages/forecast/index gt gtgt é particularmente útil. Além disso, muitos modelos em R (incluindo lm e glm) têm um argumento de pesos. Você pode chegar a qualquer esquema de ponderação que você deseja, e passá-lo para o seu modelo como um argumento de pesos. Elided Yahoo spam gtgtgt gtgtgt Existe uma função para a regressão linear exponencialmente ponderada em R gtgtgt gtgtgt Normalmente, uma regressão linear está em um tronco de dados. Gtgtgt gtgtgt E se eu executar regressão linear em séries temporais, eu dividir o tempo gtgtgt série em quotoverlapped / rollingquot janelas e executar a regressão linear gtgtgt em cada rolar pedaço de dados. Gtgtgt gtgtgt Existe uma maneira de transformar a regressão linear de rolamento em toda a série de tempo de gtgtgt em uma ponderada exponencialmente, isto é, usando um fator lambda de gtgtgt de decaimento para dar mais pesos às observações mais recentes. Gtgtgt gtgtgt Há pacotes em R que pode fazer isso gtgtgt gtgtgt Obrigado muito gtgtgt gtgtgt alternativa versão HTML gtgtgt gtgtgt gtgtgt gtgtgt ocultos e-mail lista de discussão gtgtgt stat. ethz. ch/mailman/listinfo/r-sig-finance gtgtgt - Assinante - Postagem apenas. Se você quer postar, inscreva-se primeiro. Gtgtgt - Observe também que esta não é a lista de r-help onde as perguntas gerais de R gtgtgt devem ir. Gtgtgt gtgt gtgt gt alternativa versão HTML excluído e-mail escondido lista de e-mail stat. ethz. ch/mailman/listinfo/r-sig-finance - Assinante-postagem apenas. Se você quer postar, inscreva-se primeiro. - Observe também que esta não é a lista de r-ajuda onde as perguntas R gerais devem ir. Versão alternativa HTML excluído e-mail escondido lista de e-mails stat. ethz. ch/mailman/listinfo/r-sig-finance - Subscriber-postagem apenas. Se você quer postar, inscreva-se primeiro. - Observe também que esta não é a lista de r-ajuda onde as perguntas R gerais devem ir. Interessante Neste modelo quotdiscounted LS, como é que um escolher o exponencial decadente pesos então E também ele ainda tem o tamanho da janela para janelas de rolamento. Então agora você tem dois parâmetros. Originalmente eu estava pensando em usar o tipo EMA exponencial de abordagem para remover o tamanho da janela. E usar apenas um parâmetro o lamda - o parâmetro de decaimento. Ele parece que isso pode ser facilmente resolvido usando rollApply ou period. apply e gt lm com pesos exponencialmente decrescente (na opção w). BTW, regressão gt em dados exponencialmente ponderada é muitas vezes chamado quotdiscounted mínimos quadrados gt e é o que eu chamaria de um quotpoor mansquot kalman filtro. De fato, houve alguns artigos na literatura de engenharia que mostram que a redução de gt de mínimos quadrados é equivalente a um certo tipo de filtro estimado a partir de um modelo de regressão espacial de estado gt com parâmetros variáveis ​​no tempo. Ive usado gt descontado mínimos quadrados para modelagem de dados de fundo de hedge e achei que ele funcionasse gt muito bem. Além disso, o modelo de estado-espaço de parâmetro variando o tempo pode funcionar bem com algumas variáveis ​​explicativas (1 ou 2), mas muitas vezes não gt executar gt bem se houver muitos (digamos 5 preditores). Para cada parâmetro de regressão, gt você tem que estimar um parâmetro de suavização AR (1) mais uma transição gt equação gt termo de erro. Com muitos preditores, você executa em problemas de estabilidade numérica gt muito rapidamente ea função de probabilidade pode ter muitos mínimos locais. Para gt esta razão, descontados mínimos quadrados é uma alternativa atraente. Gt Finalmente, gt é muito difícil fazer a seleção de modelo com o kalman state gt filter. Como você escolhe as variáveis ​​para entrar na equação de regressão Eu não vi ninguém fazer um estudo sistemático da seleção do modelo no tempo gt variando modelos de parâmetro. Talvez, seja aqui que uma abordagem bayesiana possa ser útil. Este é um tópico importante mas negligenciado. Gostaria de ser feliz é gt alguém me apontou para algumas pesquisas sobre este tema. Gt gt gt Eric Zivot gt Robert Richards Professor Adjunto de Economia e Diretor de Outreach gt Professor Adjunto de Finanças gt Professor Adjunto de Estatística gt Professor Adjunto de Matemática Aplicada gt Departamento de Economia gt Caixa 353330 e-mail: e-mail escondido gt Universidade de Washington telefone: 206 -543-6715 gt Seattle, WA 98195-3330 www: faculty. washington. edu/ezivot gt gt gt gt gt ----- Mensagem Original ----- gt De: e-mail escondido gt mailto: e-mail escondido Em Nome De riccardo visca gt Enviado: quinta-feira, 05 de janeiro de 2012 07:44 gt Para: Zachary Mayer Michael gt Cc: r-sig-finanças gt Assunto: Re: R-SIG-Finance exponencialmente ponderada regressão linear gt gt Eu acho que você deve Use um modelo de parâmetro variando o tempo (olhar para o pacote dlm) gt ou se você não tem tempo para aprender tente suavizar os preditores em primeiro lugar gt executar a regressão janela rolando talvez robustified. Gt gt Se você usar o filtro de Kalman use um AR (1) para o parâmetro no estado gt equação como gt gt yt bt Xt-1 gt bt c bt-1 gt gt c fará o alisamento (é o seu (1- Lambda)) gt gt Do meu ponto de vista, não há solução barata e suja para este problema. gt gt gt gt gt gt Da: Zachary Mayer lthidden email gt gt A: Michael lthidden email gt gt Cc: r-sig-finance lthidden email gt gt Inviato: Giovedl 5 Gennaio 2012 15:22 gt Oggetto: Re: R-SIG-Finance exponentially weighted linear regression gt gt Im not following you. What do you mean by quota divided trunk of dataquot As gt far as I know, lm and glm will take as much data as you give them, until gt you gt run out of memory. Why not run the lm on the whole time series gt gt Perhaps you could post a reproducible example, so we can see what youre gt trying to do. gt gt On Thu, Jan 5, 2012 at 10:16 AM, Michael lthidden email gt wrote: gt gt gt gt gt Thanks Zach. gt gt gt gt The problem with these functions (e. g. lm or glm with weights gt gt argument) is that they still do it on a divided trunk of data. i. e. gt gt block by block, not the whole time series. gt gt gt gt If we think about the exponential moving average estimate of gt gt volatility with a decay factor lamda, it is actually on the whole time gt gt series. not divided trunk of data. gt gt Any thoughts gt gt gt gt On Thu, Jan 5, 2012 at 8:40 AM, Zachary Mayer lthidden email gt gtwrote: gt gt gt gtgt Hi Michael, gt gtgt gt gtgt R has lots of functions for exponential smoothing. gt gtgt etsltrgm2.lab. nig. ac. jp/RGM2/funcrdidforecast:forecast. e gt gtgt tsgt in the forecast gt gtgt packageltcran. r-project. org/web/packages/forecast/index gt gt gtgt is particularly useful. Additionally, many models in R (including lm gt and gt glm) have a weights argument. You can come up with any weighting scheme gt you gt wish, and pass it to your model as a weights argument. gt gtgt gt gtgt There may be more useful references on the CRAN time-series task gt gtgt viewltcran. r-project. org/web/views/TimeSeries gt gt gtgt. gt gtgt gt gtgt Regards, gt gtgt gt gtgt Zach gt gtgt gt gtgt On Thu, Jan 5, 2012 at 9:30 AM, Michael lthidden email gt wrote: gt gtgt gt elided Yahoo spam gt gtgtgt gt gtgtgt Is there a function for exponentially weighted linear regression in R gt gtgtgt gt gtgtgt Usually, a linear regression is on a trunk of data. gt gtgtgt gt gtgtgt And if I run linear regression on time series, I divide the time gt gtgtgt series into quotoverlapped/rollingquot windows and run linear regression gt gtgtgt on each rolling chunk of data. gt gtgtgt gt gtgtgt Is there a way to turn the rolling linear regression on the whole gt gtgtgt time series into an exponentially weighted one, i. e. using a decay gt gtgtgt factor lambda to give more weights to the newer observations. gt gtgtgt gt gtgtgt Are there packages in R which can do that gt gtgtgt gt gtgtgt Thanks a lot gt gtgtgt gt gtgtgt alternative HTML version deleted gt gtgtgt gt gtgtgt gt gtgtgt hidden email mailing list gt gtgtgt stat. ethz. ch/mailman/listinfo/r-sig-finance gt gtgtgt -- Subscriber-posting only. If you want to post, subscribe first. gt gtgtgt -- Also note that this is not the r-help list where general R gt gtgtgt questions should go. gt gtgtgt gt gtgt gt gtgt gt gt gt gt alternative HTML version deleted gt gt gt hidden email mailing list gt stat. ethz. ch/mailman/listinfo/r-sig-finance gt -- Subscriber-posting only. If you want to post, subscribe first. gt -- Also note that this is not the r-help list where general R questions gt should go. gt alternative HTML version deleted gt gt gt alternative HTML version deleted hidden email mailing list stat. ethz. ch/mailman/listinfo/r-sig-finance -- Subscriber-posting only. If you want to post, subscribe first. -- Also note that this is not the r-help list where general R questions should go.

No comments:

Post a Comment