14/02/2017

Forecast Starter Kit: Planeje o Futuro com Base nos seus Dados Históricos

insercao_dados selecao_dados n_futures_select resultado_predicoes

Como gerar um forecast, no uberdata, usando os seus dados?

Dentro do Uberdata possuímos uma série de Starter Kits, dentre eles existe um de Forecast. Com este starter kit você consegue gerar, em alguns passos muito simples, o Forecast, ou seja, uma predição de demanda, usando dados tão simples quanto, um dado temporal e o valor a ser previsto.
Aqui será usado um exemplo de uma rede de lojas que deseja prever quanto serão as vendas (faturamento) de cada uma de suas filiais nos próximos 90 dias. Os dados são da Rossman, uma farmácia com 3000 lojas espalhadas por 7 países europeus, eles disponibilizaram os dados históricos com as vendas diárias de mais de 2 anos para uma competição no kaggle.
O objetivo da competição era prever as vendas futuras com a maior acurácia possível. As vendas podem ser influenciadas por vários fatores como promoções, competitividade, feriados escolares e nacionais.

Importação de histórico

Inserção de dados
No primeiro passo você irá selecionar o arquivo com os dados de entrada, que será usado para gerar um forecast. Este será um arquivo de histórico que basicamente necessita ter três colunas, o identificador de cada loja, uma temporal, com a data do valor observado e a outra com o valor observado. No nosso exemplo vamos usar um campo com a data (ano/mês/dia) e quanto foi vendido em cada um destes dias em cada uma das lojas. Veja que se a predição fosse de apenas uma loja não seria necessário a coluna com o identificador dela, neste caso seriam necessárias apenas duas colunas.

Visualização do histórico importado

Vizualização de Dados
Assim que os dados forem carregados no sistema, eles serão mostrados em uma tabela, onde será possível fazer uma análise prévia dos dados, formatação e nomes das colunas.

Configuração dos campos para o forecast

selecao_dados
Para realizar uma predição, devemos configurar algumas coisas, esta configuração será realizada nesta página onde indicaremos o que cada coluna representa nos nossos dados. Existem quatro campos que devem ser preenchidos conforme a descrição abaixo:

  • Campo Label
  • Label é a coluna que contem os dados que serão previstos, neste caso o faturamento de cada loja
  • Campo temporal
  • É a coluna que possui os dados temporais, que podem ser horas, datas, semanas, meses, anos, ou qualquer outro valor temporal
  • Identificador
  • Deve ser preenchida com a coluna que contem um id sequencial e único dos dados, que neste caso não será utilizado, este campo é opcional
  • Identificador do grupo
  • Campo opcional caso você queira fazer predição para mais de um conjunto, esta é a coluna que contem o id dos grupos a serem previstos, que neste caso será o id das lojas

Configuração da extensão do forecast

n_futures_select
Nesta tela você irá selecionar a quantidade de vezes que você deseja que a predição aconteça. No nosso caso iremos prever 90 dias, o valor colocado neste campo será multiplicado pela unidade do valor definido no campo Date na tela anterior, como usamos uma coluna com intervalo diário o 90 aqui quer dizer 90 dias, se tivesse sido usado uma coluna com intervalos de semanas, seriam 90 semanas e assim por diante.

Resultado

resultado_predicoes
O tempo que o forecast irá gastar para rodar irá depender da quantidade de dados de histórico carregados no sistema e também no número de máquinas que está sendo usado.
Como resultado será apresentado um gráfico com uma estimativa de precisão dos resultados previstos e nesta tela você também consegue fazer um download de um arquivo com os resultados previstos.

Comece agora mesmo a fazer analytics com o Uberdata Starter Kit!

Cadastre seu email abaixo para receber as instruções.

Você se inscreveu com sucesso!

Comece agora mesmo a fazer analytics com o Uberdata Starter Kit!

Cadastre seu email abaixo para receber as instruções.

Você se inscreveu com sucesso!