O machine learning e o time series para o planejamento da demanda

1

O planejamento da demanda é uma das tarefas mais complicadas dentro das grandes empresas. Resumidamente, ele consiste na capacidade de se planejar para que o produto certo esteja disponível no momento certo, na quantidade correta e no local certo.  Ou seja: é ele quem garante que sempre que o cliente desejar o produto, irá encontrá-lo disponível sem que, para que isso seja possível, grande volume de estoque seja criado. Um planejamento mal feito envolve custos desnecessários para a empresa, seja o custo da falta (perda da venda) ou o custo do estoque parado. Quando falamos do custo do estoque parado poderíamos citar vários tipos de custo, como por exemplo: custo da manutenção, custo da armazenagem, custo do risco de estoque, custo do pedido e outros.

Por muitos anos, métodos simples de análises de séries temporais foram utilizados para auxiliar nos desafios do planejamento da demanda. São eles: média móvel, alisamento exponencial, regressão simples ou múltipla e outros. Esses modelos acabam sendo preferidos pela sua simplicidade de interpretação e de implementação, uma vez que não necessitam de grandes recursos computacionais para a sua execução e podem ser facilmente implementados.

Apesar da vantagem da fácil interpretação e implementação, estes modelos possuem algumas desvantagens, como, por exemplo, não conseguir captar tendências ou sazonalidades de forma nativa. Algumas dessas técnicas, como médias móveis e alisamento exponencial, são exemplos de modelos que não conseguem trabalhar com variáveis e fatores exógenos (ou externos), melhorando a acurácia e adaptando os modelos à realidade do negócio (afinal, de nada adianta ter um modelo que não consegue captar e interpretar os valiosos sinais que afetam a demanda).

Com isso, outras famílias de modelos tornaram-se peças-chave para uma boa modelagem no planejamento da demanda, trazendo resultados mais condizentes com a realidade do negócio. Um bom exemplo são os modelos da família ARIMA ou ARIMAX, também conhecidos como SARIMA. Essa é uma das técnicas mais utilizadas para o planejamento da demanda, que que os modelos desta família conseguem lidar de forma nativa com as principais características presentes nas séries temporais. A família ARIMAX possui modelos autorregressivos, integrados de médias móveis e com fatores exógenos.

Os modelos ARIMAX são modelos bastante completos, pois conseguem captar e tratar os principais componentes das séries temporais que estão presentes em séries de planejamento de demanda. Além disso, eles são autorregressivos - ou seja, a série temporal é função de seu passado -, são integrados - o que significa que diferenças entre pontos sucessivos podem ser realizadas para tratar tendências e sazonalidades, caso existam -, possuem Media Móvel - a série temporal é uma função de seus erros passados - e possuem o componente exógeno, ou seja, as séries são influenciadas por fatores externos.

Sabemos que, além dos dados históricos da demanda, as empresas possuem valiosas informações de negócio como dados do ponto de vendas (PDV), preço praticado, preço planejado, histórico de promoções e planejamento futuro, preços dos concorrentes e muitas outras. São essas informações que constituem os sinais da demanda. Além disso, informações qualitativas como: greves, enchentes e pandemia também são muito úteis para enriquecer os modelos em forma de variáveis dummies (variáveis dummies são aquelas variáveis binárias nas quais conseguimos representar pelo valor 1 a ocorrência de um evento e 0 a não ocorrência dele). Um dos diferenciais quando estamos trabalhando com variáveis explicativas é a capacidade de transmitir para o modelo a justificativa de ocorrências passadas e simulações futuras. Imagina conseguir saber qual será a demanda do produto variando informações como preço futuro, feriados planejados, e outras ações! A esta atividade chamamos de construção de cenários.

Existem diversos softwares que fornecem ferramental estatístico para suportar e auxiliar nesta modelagem com os mais avançados métodos de séries temporais. O SAS, por exemplo, tem capacidade para selecionar automaticamente o melhor modelo estatístico em cada um dos níveis hierárquicos da série temporal, e pode, portanto, fornecer melhor acurácia, pois cada série temporal é uma série única com características únicas e, portanto, necessita de um modelo específico. Muitos softwares assumem que o modelo da maior hierarquia será replicado para as hierarquias abaixo, ou vice-versa, e isso pode ser perigoso, pois podemos perder valiosos sinais específicos daquela série. Uma vez que variáveis externas são utilizadas na modelagem, diferentes tipos de cenários podem ser praticados e avaliados. Realizar essa atividade de forma automatizada com a escolha do melhor modelo torna-se um diferencial, principalmente quando não é necessário codificar ou compreender de modelagem a fundo.

Ao longo dos últimos anos, vemos uma grande movimentação na utilização de modelos de Machine Learning, e a pergunta que surge é: será que podemos utilizar esses modelos para melhorar o planejamento da demanda? Será que a Inteligência Artificial pode trazer ganhos para a modelagem de séries no tempo?

A resposta é “sim, com certeza!”. Bons resultados têm se revelado no sentido de combinar técnicas como segmentação de curvas, modelos de machine learning e modelos tradicionais de séries temporais.

Ha 30 anos, Spyros Makridakis iniciou uma competição de séries temporais conhecida como M-Competitions. O objetivo dessa competição era entender, avaliar e comparar a precisão de diferentes modelos de previsão. Uma série de competições foram realizadas nas décadas de 1980 e 1990, chamadas de M1, M2 e M3. Em 2018, foi realizada a M4-Competition. O objetivo desta última competição era replicar os resultados das competições anteriores e estendê-los para incluir um número maior de modelos de séries e métodos de previsão de Machine Learning.

Você pode encontrar mais informações a respeito da competição neste artigo. 

Algumas das principais conclusões obtidas foram:

  • 70% dos métodos mais precisos eram “combinações” de abordagem estatísticas tradicionais
  • Um dos pontos mais significativos foi uma estratégia onde eles combinavam recursos de séries temporais com machine learning e obtiveram MAPEs de até 10% melhor.
  • O segundo método mais preciso foi uma combinação de 7 modelos estatísticos e 1 algoritmo de ML
  • Os 6 métodos de ML puros performaram de forma pobre. Nenhum deles foi mais preciso que o modelo combinado e apenas 1 foi superior ao modelo naive.

Existem algumas abordagens, em previsão hierárquica, que permitem realizar e comparar rapidamente diferentes estratégias de modelagem como a MultiStage, por exemplo. Essa estratégia combina modelos de séries temporais, ou regressão ou rede neural nos maiores níveis da hierarquia (onde, normalmente, captamos com maior facilidade as componente de séries temporais) com modelos de machine learning nos níveis menores, permitindo que estes componentes que não podem ser captados facilmente no menor nível sejam realimentados a partir do aprendizado da rede.

Dito isto, vimos que a utilização de modelos de Machine Learning para a previsão no tempo pode, sim, enriquecer muito a modelagem, desde que seja usada com cautela e respeitando as características das séries analisadas. É preciso tomar cuidado com as generalizações de automatização total do processo de planejamento da demanda. Existem informações e processos, como identificação e construção de novas variáveis explicativas, que, uma vez encontradas, podem facilmente ser automatizadas. De acordo com os resultados da competição M4, podemos assumir que todas as abordagens têm vantagens e desvantagens. O ponto ótimo da modelagem é atingido quando exploramos as vantagens minimizando as desvantagens e encontrando sentido ao que está sendo modelado.

Tags
Share

About Author

Mariana Fontanezi

Customer Advisory, SAS

Mariana Fontanezi é graduada em Estatística pela Escola Nacional de Ciências Estatísticas e pós graduada em Engenharia de Produção pela Universidade Federal Fluminense. É Customer Advisory na área de Analytics no SAS, com foco nas principais soluções para planejamento de demanda, técnicas de otimização, técnicas de pricing nas industrias: varejo, manufatura, energia, telecom e outras. É especialista em técnicas de séries temporais utilizando os principais softwares de mercado como: SAS Forecast Server, SAS Visual Forecasting, SAS Econometric and Time Series (ETS), SAS Forecast Analyst Workbench, R. Possui conhecimento em análise de dados e técnicas de Data Mining com experiência e visão em diferentes áreas de negócio.

1 Comment

  1. Eduardo Nascimento on

    Olá Mariana boa noite.
    Excelente artigo. Estou trabalhando na minha dissertação: ANÁLISE DE INTERRUPÇÕES DO FORNECIMENTO DE ENERGIA ELÉTRICA NO NORDESTE DO BRASIL. Preciso usar séries temporais para previsão de ocorrências de falta de energia . Estou usando o SAS para processamento e análise dos dados . Poderria me ajudar enviando materiais que possam me ajudar n interpretação dos resultados ?

Leave A Reply

Back to Top