Uma abordagem introdutória
O uso de desagregação de séries temporais com o pacote tempdisagg em modelos econométricos
Quando podemos e usamos agregação de dados de séries temporais ?
Distinções entre dividir e desagregar dados de séries temporais
Como e por quê desagregar uma série temporal ?
Quais critérios de desagregação devo empregar ?
Alguns exemplos de aplicação
Esclarecimento de dúvidas
Agradecimentos
Alguns exemplos de séries temporais usualmente agregadas…
Fonte: moneyreport.com.br, 12/09/23
Aqui os economistas fazem um produtório pra denotar a taxa acumulada até o período \(n\):
\[ i_{\mbox{acumulada}} = \displaystyle \prod ^{n}_{t=1}(1+i)\cdot(1+i) \]
Fonte: Agencia de Noticias IBGE
Aqui geralmente se faz uma soma da quantidade produzida em kgs ou toneladas ao longo de um determinado período de tempo:
\[ \widehat{\mbox{Safra}}_t = \sum^{n}_{t=1} \mbox{volume}_t \]
Imagine que você necessita calcular as parcelas de um financiamento mensalmente. Você sabe de antemão que a taxa de juros básica (referência) da economia brasileira é a taxa SELIC que é unicamente de contabilização anual…
Fonte: monitordomercado.com.br
Aqui a taxa SELIC mensal é dada por \(\mbox{SELIC}_{\mbox{mês}} = (1+i)^{(q/t)} = (1+13,25\%)^{(1/12)} \Rightarrow 1,042290887\%\,a.m.\)
Fonte: Brasil61
Mas, qual seria o problema em se fazer essas operações simples de dividir, somar ou multiplicar ?
E se quiséssemos construir um modelo econométrico de séries temporais, digamos pra prever os preços diários do milho na CBOT em função de alguns dados de demanda e de oferta, por exemplo ?
Fonte: Bloomberg a partir de dados de FAS/USDA, dados de exportações mensais e “diarizadas” de milho norte-americano
Será que terá um bom fit estatístico ?
Fonte: Bloomberg a partir de dados de FAS/USDA, dados de preços de fechamento diário de milho norte-americano x exportações americanas
"Uma variável aleatória é nada mais que uma função que mapeia os resultados de um processo estocástico (aleatório) em valores numéricos."
Relações determinísticas x estocásticas (vide Gujarati & Porter, 2011 p. 28)
O sentido “econômico” das relações com os dados disponíveis precisa existir !
Um bom modelo sempre será aquele que mais se adequa à realidade de acordo com as possibilidades …
Mas então, como construir um modelo que seja “mais realista” com os dados de exportação, produção, taxas e etc. ?
Como preservar a verdadeira variabilidade nas exportações dia-a-dia e construi-la de maneira mais realista ?
Afinal, quem exporta, exporta todo dia, quem produz, produz todo dia e não somente mensalmente p. ex. …
O glorioso trabalho e contribuição de Sax & Steiner (2013) !!!
Os autores uparam alguns “tutoriais de uso” Vignettes – “Disaggregating annual data to quarterly” para usuários do R;
Ps* No Python existe uma iniciativa de replicação da tempdisagg, mas me pareceu inacabada (veja aqui o repo no GitHub da biblioteca timedisagg)
Como que eu utilizei e adaptei o tratamento da desagregação para o meu caso ?
Mas, como sei qual critério devo utilizar para a minha série temporal, em específico ?
Afinal, não posso desagregar uma série temporal de um dado de produção do mesmo modo que desagrego uma taxa, por exemplo …
Como desagrego, pra diário, uma série temporal de preços com disponibilidade de publicação unicamente semanal numa fonte oficial ?
Como desagrego, pra construir uma série diária, um dado que é um número-índice, como o índice de anomalia do El Niño, por exemplo ?
Como no meu caso, os dados que eu possuía se referiam as quantidades de milho exportadas mensalmente, eu utilizei o critério de desagregação pela soma.
Afinal os órgãos de estatística oficiais dos governos contabilizam uma soma do volume total exportado em toneladas mensalmente e as divulgam dessa maneira…
Mas se a série for de preços, posso utilizar o critério de desagregação por “similaridade” como o last ou o first por exemplo;
Para variáveis que seriam taxas acumuladas, posso utilizar o critério de desagregação pelas médias (geométricas) por exemplo…
Para números-indices como o El Niño por exemplo, posso utilizar de técnicas mais elaboradas de desagregação combinando p. ex. similaridade com os desvios em relação as oscilações médias…Ou criar uma feature utilizando um simulador de ruído branco…
Desagregação da série temporal da Produção de Milho no Brasil de mês pra dia;
Desagregação da série do El Niño
Desagregação e preenchimento de missing data com técnica de backcasting e bootstrapping
Desgregação de dados temporais de área colhida de milho na Ucrânia
Desagregação a séries de preços do óleo de palma negociado na Malásia/Mundo
Angrist, Joshua D., and Jörn-Steffen Pischke. Mastering ’Metrics: The Path from Cause to Effect. Princeton University Press, 2014.
Angrist, Joshua D., and Jörn-Steffen Pischke. Mostly Harmless Econometrics: An Empiricist’s Companion. Princeton University Press, 2009.
FAO. Price volatility in food and agricultural markets: Policy Responses. 2011. Disponível em: http://www.oecd.org/tad/agricultural-trade/48152638.pdf. Acessado em Abr 2022
Pearl, Judea, Madelyn Glymour, and Nicholas P. Jewell. Causal Inference in Statistics: A Primer. Wiley, 2016.
Granger, C. W. J. Empirical modeling in economics. Reino Unido: Cambridge University Press, 1999. p. 58.
Gujarati, D.,N. Basic Econometrics, fourth edition, McGraw-HiII/lrwin, 2011.
Hyndman, R.J., & Athanasopoulos, G. (2021) Forecasting: principles and practice, 3rd edition, OTexts: Melbourne, Australia. OTexts.com/fpp3. Accessed on <may 2023>.
Maddala, G.,S. Introdução à Econometria, terceira edição, LTC, Rio de Janeiro, 2001.
Pedace, R. Econometrics for Dummies. John Wiley & Sons, 2013.
Sax, C. & Steiner, P. Temporal Disaggregation of Time Series. In The R Journal Vol. 5/2, December 2013 ISSN 2073-4859.
Rodrigo Hermont Ozon
\(\Rightarrow\) A todo o comitê organizador do 4º R Day e do 1th SouthStat Meeting
\(\Rightarrow\) Ao professor Matheus Dal Molin Ribeiro da UTFPR;
\(\Rightarrow\) Agradecimentos aos pesquisadores do PPGEPS/PUCPR, aos ouvintes e em especial ao meu orientador, prof. Dr. Gilberto Reynoso Meza