Free Trial

Blog

Insights e ideias das mentes mais brilhantes em análise de dados.
Garabujo7
Alteryx
Alteryx

Nesta última parte, vamos focar no resultado, entender os resultados do modelo para explicá-lo e colocá-lo em produção para que comece a gerar valor imediatamente.

 

Automodelagem

 

Uma vez que selecionamos os parâmetros de nossos modelos, nós os treinamos. No meu caso, selecione uma montagem de modelos. Uma vez estimados, passamos à seção Auto Model para ver os resultados gerais dos modelos.

 

A primeira coisa que verificamos é a lista de modelos e sua posição de acordo com as métricas que você deu.

 

A plataforma possui 10 técnicas de aprendizado de máquina disponíveis para gerar os modelos. Isso é uma grande vantagem porque não dependemos de apenas um modelo. Além disso, ele buscará a melhor combinação de variáveis e parâmetros que forneçam os melhores resultados automaticamente. Desta forma vamos focar na análise dos resultados ao invés de trabalhar na criação e configuração dos modelos.

 

 

Homero.gif

 

 

Esses são alguns dos modelos que ele treinou, com as métricas que selecionamos.

 

 

Garabujo7_1-1659736487628.png

 

 

 

O modelo que a plataforma recomenda é o seguinte:

 

 

Garabujo7_2-1659736487630.png

 

 

Se quisermos alterar a métrica de avaliação, podemos fazê-lo e a classificação dos modelos mudará.

 

 

 

Garabujo7_3-1659736487631.png

 

 

Avaliação do modelo

 

Quando vamos para a Avaliação do Modelo, que é a parte mais relevante do processo, podemos ver os resultados gerais.

 

Geral


Aqui é apresentado o desempenho do modelo na validação cruzada, o conjunto de dados reservado e o tamanho da amostra que foi utilizada para o treinamento do modelo.

 

 

Garabujo7_4-1659736487632.png

 

 

Também nos apresenta o pipeline analítico que foi usado para criar cada modelo, com todas as etapas que ele seguiu.

 

É aqui que podemos ver que o modelo realiza automaticamente a imputação das variáveis. Dependendo do conjunto de dados, ele também pode executar outras ações automaticamente, como tratar valores discrepantes ou variáveis de destino desbalanceadas.

 

 

Garabujo7_5-1659736487634.png

 

 

Atuação

 

Aqui começamos a revisar as métricas, podemos ver as de cada um dos modelos que foram criados.

 

Ele nos mostra o resultado da validação cruzada e os dados retidos.

 

 

Garabujo7_6-1659736487636.png

 

 

A matriz de confusão apresenta a capacidade do modelo de prever corretamente cada uma das categorias e o número de erros cometidos, tanto em contagem quanto em porcentagem do total.

 

 

Garabujo7_7-1659736487639.png

 

 

Na curva ROC vemos a diferença entre o acaso ou não agir e o valor que a aplicação do modelo traria.

 

Nesse caso, nos dá uma área sob a curva (AUC) de 93%, o que é um bom resultado junto com o da matriz de confusão, que mostra que o modelo está sendo eficaz em prever a variável alvo sem memorizar dados ou generalizar demais.

 

 

Garabujo7_8-1659736487642.png

 

 

Insights

 

Dentro da parte de achados, podemos ver a importância das características tanto em uma lista com as principais quanto em um gráfico.

Aqui também encontramos variáveis artificiais que foram criadas automaticamente pela plataforma com o processo Feature Engineering.

 

Neste caso, os números 3, 10 e 16 são artificiais. O primeiro é o preço médio por quarto, o logaritmo natural dos dias de antecedência no momento da reserva e o logaritmo natural do número de adultos na reserva.

 

 

Garabujo7_9-1659736487648.png

 

Garabujo7_10-1659736487650.png

 

 

Para entender melhor a influência que cada variável tem individualmente no resultado, usamos a dependência parcial.

Selecionamos cada uma das variáveis mais importantes e analisamos o gráfico para ver como alterar os valores altera o resultado. O interessante é que podemos ver cada uma das características de forma independente e entender sua influência.

 

 

Garabujo7_11-1659736487654.png

 

 

Simulações

 

Para continuar com a análise dos resultados, a plataforma permite criar cenários hipotéticos. Usando alguns dos registros ou escolhendo um ao acaso, podemos ver a influência que as mudanças nas principais características têm para o resultado da previsão.

 

Dessa forma podemos tomar decisões sobre os dados que temos e buscar focar em detalhes específicos de alguns deles, de acordo com sua influência no resultado.

 

Podemos comparar os resultados de acordo com a distribuição de cada uma das variáveis, para observar seu possível efeito. Com isso podemos facilmente pensar em implementar mudanças para a captura de informações ou a melhor forma de utilizar o que temos disponível.

 

 

 

Garabujo7_12-1659736487663.png

 

 

Exportação e Pontuação

 

Exportar os Gráficos

 

Se você precisar revisar com mais detalhes ou discutir com o restante de sua equipe os gráficos da plataforma. Esta parte permite exportá-los, seja em Power Point, prontos para apresentá-los ou o conjunto de imagens em um Zip.

 

 

Garabujo7_13-1659736487664.png

 

Novos Dados para Pontuação

 

Para qualificar novos dados usando o modelo treinado, podemos fazê-lo diretamente na plataforma. Ou fazendo upload de um arquivo ou usando um que esteja no gerenciador de ativos da plataforma.

 

 

Garabujo7_14-1659736487666.png

 

 

Integração com o Designer

 

A última etapa é a exportação do modelo campeão treinado, para poder implantá-lo em produção por meio do Alteryx Designer ou Alteryx Server para que possa ser agendado e chamado por meio de APIs.

 

 

Garabujo7_15-1659736487666.png

 

 

Conclusão

 

Neste artigo, revisamos uma parte da plataforma de nuvem Alteryx, que nos permite criar facilmente modelos de aprendizado de máquina para resolver desafios de negócios de maneira sistemática e com foco nos resultados e não no processo nem nos detalhes para criá-los.

 

Além de podermos criar modelos, a integração da plataforma Alteryx nos permite preparar, unificar e limpar os dados, além de qualificá-los e colocá-los em produção para serem executados automaticamente ou por meio de chamadas de API com o servidor Alteryx.

 

Quanto ao desafio de negócios que usamos, o benefício seria que agora, sendo um usuário sem experiência em ciência de dados, mas com amplo conhecimento de negócios, posso capitalizá-lo e criar um modelo que ajude a identificar os clientes que manterão suas reservas para reduzir custos e poder planejar com antecedência a demanda.

 

Um benefício adicional é que, utilizando as características mais importantes identificadas pelo modelo, mais sua dependência parcial e as simulações, é possível desenhar novas estratégias para atrair clientes ou criar promoções alinhadas a essas variáveis.

 

 

Importância das funcionalidadesImportância das funcionalidades

 

 

 

Dependência ParcialDependência Parcial

 

 

SimulaçõesSimulações

 

 

 

Com esses resultados e sem usar código ou programação, dentro da mesma plataforma poderemos colocar o modelo em produção para começar a ver rapidamente os benefícios do negócio, acelerando o tempo que leva para gerar valor com a solução.

 

Foi uma longa jornada, mas eu queria mostrar essa nova funcionalidade com um exemplo real do início ao fim, para que você conheça o processo, a facilidade de uso e, acima de tudo, a orientação para os resultados do negócio ao invés da especialização do usuário.

 

Rótulos