MAPE, MAE, WMAPE e Bias: o que os números de forecast realmente dizem

ANALYTICS & FORECAST

MAPE, MAE, WMAPE e Bias: o que os números de forecast realmente dizem

Todo sistema de forecast reporta acurácia. O problema é que a mesma métrica pode significar coisas completamente diferentes dependendo de como é calculada — e fornecedores sabem exatamente como escolher o número que parece melhor na proposta comercial.

Tempo de leitura: 12 min


Por que a acurácia de forecast é fácil de mentir

Um fornecedor de sistema de forecast apresenta acurácia de 94%. Parece ótimo. Mas há perguntas que raramente são feitas antes de aceitar esse número: 94% medido como? Sobre quais SKUs? Em qual período? Com qual método de validação? Em qual subconjunto da base de dados?

Cada uma dessas escolhas metodológicas pode mover a acurácia reportada em 20 a 30 pontos percentuais sem que o modelo tenha mudado nada. Um sistema com acurácia real de 68% pode reportar 94% se as escolhas de cálculo forem favoráveis o suficiente.

Isso não é necessariamente desonestidade — é que não há padronização sobre como métricas de forecast devem ser calculadas e reportadas. Cada fornecedor usa a definição que melhor representa seu produto. E a maioria dos compradores não tem o repertório técnico para questionar as escolhas metodológicas.

O objetivo deste artigo não é ensinar a construir modelos de forecast. É dar ao gestor de supply chain, ao CFO e ao gerente de PCP o repertório para fazer as perguntas certas quando um número de acurácia for apresentado — seja por um fornecedor, por um consultor ou pelo próprio time interno.


MAPE: a métrica mais usada e mais mal usada

MAPE significa Mean Absolute Percentage Error — erro percentual absoluto médio. Para cada SKU em cada período, ele calcula a diferença entre o que foi previsto e o que foi realizado, em termos percentuais. A média desses erros percentuais, ao longo de todos os SKUs e períodos avaliados, é o MAPE.

A vantagem do MAPE é que ele é intuitivo: um MAPE de 15% significa que, em média, o modelo errou 15% para cima ou para baixo. É fácil de comunicar para gestores não técnicos e de comparar entre modelos.

Mas o MAPE tem quatro limitações sérias que raramente são mencionadas quando o número aparece em uma apresentação:

Limitação 1: MAPE é indefinido para demanda zero

Quando a demanda realizada em um período é zero — nenhuma venda, ruptura de estoque, sazonalidade extrema — o MAPE é matematicamente indefinido (divisão por zero). Sistemas que incluem esses períodos no cálculo precisam de um tratamento especial para esses casos. Sistemas que os excluem do cálculo têm um MAPE artificialmente melhor, porque excluíram os períodos mais difíceis de prever.

A pergunta relevante: o MAPE reportado inclui períodos com demanda zero, ou eles foram excluídos do cálculo?

Limitação 2: MAPE trata todos os SKUs como equivalentes

Um erro de 20% em um SKU que vende 10 unidades por mês e um erro de 20% em um SKU que vende 10.000 unidades por mês têm o mesmo peso no MAPE — mas impactos financeiros completamente diferentes. O MAPE simples não diferencia pela importância relativa de cada produto.

Limitação 3: MAPE é assimétrico para superestimação e subestimação

Matematicamente, um erro de subestimação de 100% (previu 50, realizou 100) tem o mesmo MAPE que um erro de superestimação de 100% (previu 200, realizou 100). Mas as consequências operacionais são opostas: subestimação gera ruptura de estoque e venda perdida; superestimação gera excesso de estoque e capital imobilizado. O MAPE não captura essa diferença.

Limitação 4: MAPE penaliza desproporcionalmente erros em baixos volumes

Um produto que vende 2 unidades em média, com realização de 3 unidades em um mês, tem erro de 50% — o que parece alto, mas representa apenas 1 unidade adicional de diferença. Esses produtos de baixo volume com alta variabilidade inflam o MAPE sem que o impacto real seja proporcional ao erro percentual registrado.


MAE: quando o erro absoluto importa mais que o percentual

MAE significa Mean Absolute Error — erro absoluto médio. Em vez de calcular o erro como percentual da demanda realizada, ele calcula a diferença absoluta entre previsto e realizado, e faz a média dessas diferenças.

Um MAPE de 25% em um produto que vende 100 unidades por mês representa um erro médio de 25 unidades. Um MAPE de 25% em um produto que vende 1.000 unidades representa um erro médio de 250 unidades. O MAE captura essa diferença — o MAPE não.

O MAE é mais útil quando o objetivo é entender o impacto operacional do erro: quantas unidades, em média, o modelo está errando? Essa informação é diretamente relevante para calcular o estoque de segurança necessário para cobrir a incerteza da previsão.

A limitação do MAE é que ele não é comparável entre SKUs com volumes muito diferentes. Um MAE de 50 unidades é aceitável para um produto que vende 1.000 unidades por mês (erro de 5%) e problemático para um produto que vende 60 unidades por mês (erro de 83%).

MétricaO que calculaMelhor paraLimitação principal
MAPEErro percentual médioComparar acurácia entre períodos e modelosInválido para demanda zero; não pondera por importância do SKU
MAEErro absoluto médio (em unidades)Dimensionar estoque de segurança; entender impacto operacionalNão comparável entre SKUs com volumes diferentes
WMAPEErro percentual ponderado por volume ou valorVisão financeiramente relevante da acurácia do portfólioPode esconder erros em SKUs de baixo volume mas alta criticidade
BiasDireção sistemática do erro (superestima ou subestima?)Identificar distorção sistemática no modeloPode ser zero mesmo com erros grandes se erros se cancelam

WMAPE: a métrica que o CFO deveria exigir

WMAPE é o Weighted Mean Absolute Percentage Error — MAPE ponderado. Em vez de calcular a média simples dos erros percentuais de todos os SKUs, ele pondera cada SKU pelo seu peso no volume total ou na receita total.

Por que isso importa? Porque em qualquer portfólio industrial, a regra 80/20 é a norma: 20% dos SKUs respondem por 80% do volume ou da receita. Um MAPE calculado igualmente sobre todos os SKUs pode estar sendo dominado pelos produtos de baixo volume — que têm erros percentuais altos, mas impacto financeiro baixo — enquanto os produtos que realmente movem o negócio têm acurácia bem diferente.

O WMAPE corrige esse desequilíbrio. Ele diz: quanto o modelo erra, ponderando pela importância financeira de cada produto? Essa é a pergunta que o CFO quer responder, porque é a que traduz erro de forecast em risco de capital de giro.

Um sistema com MAPE de 22% e WMAPE de 9% está errando bastante nos produtos de baixo volume — mas nos produtos que realmente importam para o caixa, o erro é controlado. Esse é um resultado diferente — e melhor — do que MAPE de 22% com WMAPE de 20%.


Bias: a métrica que revela o que as outras escondem

Bias é a medida de direção sistemática do erro. Enquanto MAPE, MAE e WMAPE medem a magnitude do erro (quanto o modelo erra), o Bias mede se o modelo tende a errar consistentemente para cima (superestimação) ou para baixo (subestimação).

Um modelo com MAPE de 15% e Bias próximo de zero está errando 15% — mas os erros são aleatórios, distribuídos simetricamente entre superestimação e subestimação. Isso é aceitável — é o que se espera de um modelo bem calibrado com algum grau de incerteza inerente.

Um modelo com MAPE de 12% e Bias de +8% é preocupante. Ele está consistentemente superestimando — prevendo mais do que a demanda realiza. Isso cria um padrão sistemático de excesso de estoque que se acumula ao longo dos meses. O MAPE parece aceitável, mas o Bias revela que o erro não é aleatório — é um problema estrutural no modelo.

As consequências operacionais do Bias positivo versus negativo

Tipo de BiasO modelo fazConsequência operacionalImpacto financeiro
Bias positivo (superestima)Prevê mais do que a demanda realizaCompras excessivas, excesso de estoque, giro baixoCapital de giro imobilizado; custo de carregamento; risco de vencimento (farmacêutico)
Bias negativo (subestima)Prevê menos do que a demanda realizaCompras insuficientes, rupturas, vendas perdidasReceita não realizada; custo de compra emergencial; perda de cliente
Bias próximo de zeroErros aleatórios em ambas as direçõesVariabilidade gerenciável com estoque de segurança adequadoCusto de estoque de segurança proporcional ao MAPE; sem perda sistemática

O Bias é particularmente importante porque ele é diagnóstico — indica o tipo de correção necessária no modelo. Um Bias positivo consistente em produtos com sazonalidade pode indicar que o modelo está superweightando períodos de pico histórico. Um Bias negativo consistente em produtos com tendência de crescimento pode indicar que o modelo não está capturando a tendência adequadamente.


Como ler um relatório de acurácia com critério

Quando um relatório de acurácia de forecast chega para aprovação — de um sistema interno, de um fornecedor em processo de avaliação ou de uma consultoria que implantou um modelo — há sete perguntas que determinam se o número reportado corresponde à realidade ou é uma construção favorável:

  1. Quais SKUs foram incluídos no cálculo? Se apenas os SKUs com histórico suficiente e baixa variabilidade foram incluídos, o número é uma seleção favorável, não uma média representativa.
  2. Como foram tratados os períodos com demanda zero? Exclusão desses períodos melhora artificialmente o MAPE. Inclusão com tratamento adequado (MAE ou WMAPE) é mais honesta.
  3. A validação foi por backtesting ou por walk-forward? Backtesting produz números significativamente melhores do que a performance real prospectiva. Walk-forward é o padrão para reportar acurácia realista.
  4. O Bias está reportado? Um relatório de acurácia sem Bias está escondendo metade da informação relevante. O MAPE pode ser aceitável enquanto o Bias revela um problema sistemático.
  5. A acurácia está segmentada por categoria de SKU? A média geral pode esconder que os produtos de alta rotatividade têm acurácia excelente enquanto os sazonais têm acurácia inaceitável — ou o inverso.
  6. Qual é o WMAPE, não apenas o MAPE? Se apenas o MAPE for reportado, não é possível saber se a acurácia nos produtos financeiramente relevantes é diferente da média geral.
  7. O erro está reportado por período — mês a mês — ou apenas como média anual? Uma média anual de 15% pode esconder picos sazonais de 40% nos meses críticos.

O que um bom benchmark de acurácia parece

Não existe um MAPE universalmente “bom”. O benchmark relevante depende do setor, da volatilidade da demanda, do nível de agregação (SKU por dia versus SKU por mês), e do processo de previsão atual com o qual o modelo está sendo comparado.

Como referência geral para empresas industriais brasileiras, com previsão mensal por SKU:

MAPE mensal por SKUAvaliação geralContexto típico
Abaixo de 10%ExcelenteProdutos de alta rotatividade, baixa sazonalidade, demanda estável
10% a 20%BomMaioria dos produtos industriais com histórico adequado e volatilidade moderada
20% a 35%Aceitável com restriçõesProdutos sazonais, demanda irregular, mix de canais com comportamentos distintos
35% a 50%ProblemáticoIndica dados ruins, modelo inadequado para o produto, ou sazonalidade não capturada
Acima de 50%InaceitávelO modelo não está adicionando valor; planilha de média seria comparável

O benchmark mais relevante não é contra um número abstrato de “bom” — é contra o processo atual da empresa. Se a empresa opera hoje com MAPE de 38%, um modelo que entrega MAPE de 22% está entregando valor real, mesmo que 22% pareça longe de perfeito. A melhora relativa é o que importa para o cálculo de ROI.


Como o erro de forecast se traduz em custo de estoque

A conexão entre MAPE e custo financeiro raramente é feita de forma explícita nos relatórios de supply chain. Mas ela existe e é calculável.

O estoque de segurança necessário para cobrir a incerteza da previsão é proporcional ao erro do modelo. Com um MAPE de 30%, uma empresa precisa manter significativamente mais estoque de segurança do que com um MAPE de 10% — para o mesmo nível de serviço ao cliente. A diferença no capital imobilizado em estoque de segurança, para um portfólio de 500 SKUs com giro médio de R$ 5 milhões, pode facilmente representar R$ 800 mil a R$ 1,5 milhão.

Quando essa conexão é feita explicitamente — MAPE atual × custo de capital × valor médio de estoque = custo financeiro do erro de previsão — a discussão sobre investimento em melhoria de forecast muda de natureza. Deixa de ser uma discussão técnica sobre algoritmos e passa a ser uma análise financeira sobre retorno sobre capital.

Um CFO que entende que reduzir o MAPE de 28% para 14% libera R$ 1,2 milhão em capital de giro toma uma decisão de investimento diferente do CFO que recebe apenas um relatório dizendo que “a acurácia do forecast melhorou 14 pontos percentuais”. O número técnico é o mesmo. O contexto financeiro é o que faz a diferença.


Por que as métricas de erro precisam ser visíveis por SKU

A média de MAPE de um portfólio é útil para acompanhamento geral — mas perigosa como única métrica de gestão. Ela esconde a distribuição dos erros, e é na distribuição que estão os problemas reais.

Um MAPE médio de 18% pode coexistir com 40 SKUs com MAPE acima de 50%. Esses 40 SKUs podem representar 15% do portfólio em número, mas 30% do capital imobilizado em estoque. A média está correta — mas não está revelando onde estão os problemas que precisam de atenção.

O processo de gestão de forecast eficaz não monitora a média — monitora a distribuição. Identifica os SKUs fora do threshold, investiga as causas (dado ruim, modelo inadequado, evento não capturado, produto com comportamento estruturalmente imprevisível) e toma ações específicas para cada caso.

Isso exige que o sistema de forecast exponha o erro por SKU, não apenas a média agregada. Sistemas que reportam apenas o MAPE geral estão oferecendo uma visão que é insuficiente para gestão efetiva — independentemente do quão impressionante o número pareça.


Acurácia de 94% é um número. O que importa é o que está por trás dele.

O EpiphanyAI é a plataforma de IA Auditável da Direção e Sentido. O módulo de forecast reporta MAPE, MAE, WMAPE e Bias por SKU — validados por walk-forward, não por backtesting — para que o planejador saiba exatamente onde o modelo está acertando e onde está errando, e possa agir antes que o erro vire custo.

→ Fale com um especialista


Nem todo gerente de PCP concordaria com o que está escrito aqui. Na semana que vem, o contraponto.


Continue lendo:

Direção e Sentido Estratégia e Inovação — Mais de 20 anos transformando dados em decisões.

Fale com a equipe EpiphanyAI

Dúvidas sobre IA Auditável, modalidades ou preços? Estamos aqui.

Fale conosco

Entre em contato por e-mail ou redes sociais.

Envie um e-mail

LinkedIn

Ligue para nós

Seg–Sex, 8h às 18h.

(11) 3230-7890

Fale com a gente

Converse com nosso pessoal de São Paulo

Av. Dr. Chucri Zaidan, 296 CJ. 231