- Inscrever-se no RSS Feed
- Marcar como novo
- Marcar como lido
- Marcar como favorito
- Inscrever-se
- Versão para impressão
- Notificar o moderador
- Inscrever-se no RSS Feed
- Marcar como novo
- Marcar como lido
- Marcar como favorito
- Inscrever-se
- Versão para impressão
- Notificar o moderador
Nesta última parte, vamos focar no resultado, entender os resultados do modelo para explicá-lo e colocá-lo em produção para que comece a gerar valor imediatamente.
Automodelagem
Uma vez que selecionamos os parâmetros de nossos modelos, nós os treinamos. No meu caso, selecione uma montagem de modelos. Uma vez estimados, passamos à seção Auto Model para ver os resultados gerais dos modelos.
A primeira coisa que verificamos é a lista de modelos e sua posição de acordo com as métricas que você deu.
A plataforma possui 10 técnicas de aprendizado de máquina disponíveis para gerar os modelos. Isso é uma grande vantagem porque não dependemos de apenas um modelo. Além disso, ele buscará a melhor combinação de variáveis e parâmetros que forneçam os melhores resultados automaticamente. Desta forma vamos focar na análise dos resultados ao invés de trabalhar na criação e configuração dos modelos.
Esses são alguns dos modelos que ele treinou, com as métricas que selecionamos.
O modelo que a plataforma recomenda é o seguinte:
Se quisermos alterar a métrica de avaliação, podemos fazê-lo e a classificação dos modelos mudará.
Avaliação do modelo
Quando vamos para a Avaliação do Modelo, que é a parte mais relevante do processo, podemos ver os resultados gerais.
Geral
Aqui é apresentado o desempenho do modelo na validação cruzada, o conjunto de dados reservado e o tamanho da amostra que foi utilizada para o treinamento do modelo.
Também nos apresenta o pipeline analítico que foi usado para criar cada modelo, com todas as etapas que ele seguiu.
É aqui que podemos ver que o modelo realiza automaticamente a imputação das variáveis. Dependendo do conjunto de dados, ele também pode executar outras ações automaticamente, como tratar valores discrepantes ou variáveis de destino desbalanceadas.
Atuação
Aqui começamos a revisar as métricas, podemos ver as de cada um dos modelos que foram criados.
Ele nos mostra o resultado da validação cruzada e os dados retidos.
A matriz de confusão apresenta a capacidade do modelo de prever corretamente cada uma das categorias e o número de erros cometidos, tanto em contagem quanto em porcentagem do total.
Na curva ROC vemos a diferença entre o acaso ou não agir e o valor que a aplicação do modelo traria.
Nesse caso, nos dá uma área sob a curva (AUC) de 93%, o que é um bom resultado junto com o da matriz de confusão, que mostra que o modelo está sendo eficaz em prever a variável alvo sem memorizar dados ou generalizar demais.
Insights
Dentro da parte de achados, podemos ver a importância das características tanto em uma lista com as principais quanto em um gráfico.
Aqui também encontramos variáveis artificiais que foram criadas automaticamente pela plataforma com o processo Feature Engineering.
Neste caso, os números 3, 10 e 16 são artificiais. O primeiro é o preço médio por quarto, o logaritmo natural dos dias de antecedência no momento da reserva e o logaritmo natural do número de adultos na reserva.
Para entender melhor a influência que cada variável tem individualmente no resultado, usamos a dependência parcial.
Selecionamos cada uma das variáveis mais importantes e analisamos o gráfico para ver como alterar os valores altera o resultado. O interessante é que podemos ver cada uma das características de forma independente e entender sua influência.
Simulações
Para continuar com a análise dos resultados, a plataforma permite criar cenários hipotéticos. Usando alguns dos registros ou escolhendo um ao acaso, podemos ver a influência que as mudanças nas principais características têm para o resultado da previsão.
Dessa forma podemos tomar decisões sobre os dados que temos e buscar focar em detalhes específicos de alguns deles, de acordo com sua influência no resultado.
Podemos comparar os resultados de acordo com a distribuição de cada uma das variáveis, para observar seu possível efeito. Com isso podemos facilmente pensar em implementar mudanças para a captura de informações ou a melhor forma de utilizar o que temos disponível.
Exportação e Pontuação
Exportar os Gráficos
Se você precisar revisar com mais detalhes ou discutir com o restante de sua equipe os gráficos da plataforma. Esta parte permite exportá-los, seja em Power Point, prontos para apresentá-los ou o conjunto de imagens em um Zip.
Novos Dados para Pontuação
Para qualificar novos dados usando o modelo treinado, podemos fazê-lo diretamente na plataforma. Ou fazendo upload de um arquivo ou usando um que esteja no gerenciador de ativos da plataforma.
Integração com o Designer
A última etapa é a exportação do modelo campeão treinado, para poder implantá-lo em produção por meio do Alteryx Designer ou Alteryx Server para que possa ser agendado e chamado por meio de APIs.
Conclusão
Neste artigo, revisamos uma parte da plataforma de nuvem Alteryx, que nos permite criar facilmente modelos de aprendizado de máquina para resolver desafios de negócios de maneira sistemática e com foco nos resultados e não no processo nem nos detalhes para criá-los.
Além de podermos criar modelos, a integração da plataforma Alteryx nos permite preparar, unificar e limpar os dados, além de qualificá-los e colocá-los em produção para serem executados automaticamente ou por meio de chamadas de API com o servidor Alteryx.
Quanto ao desafio de negócios que usamos, o benefício seria que agora, sendo um usuário sem experiência em ciência de dados, mas com amplo conhecimento de negócios, posso capitalizá-lo e criar um modelo que ajude a identificar os clientes que manterão suas reservas para reduzir custos e poder planejar com antecedência a demanda.
Um benefício adicional é que, utilizando as características mais importantes identificadas pelo modelo, mais sua dependência parcial e as simulações, é possível desenhar novas estratégias para atrair clientes ou criar promoções alinhadas a essas variáveis.
Importância das funcionalidades
Dependência Parcial
Simulações
Com esses resultados e sem usar código ou programação, dentro da mesma plataforma poderemos colocar o modelo em produção para começar a ver rapidamente os benefícios do negócio, acelerando o tempo que leva para gerar valor com a solução.
Foi uma longa jornada, mas eu queria mostrar essa nova funcionalidade com um exemplo real do início ao fim, para que você conheça o processo, a facilidade de uso e, acima de tudo, a orientação para os resultados do negócio ao invés da especialização do usuário.
Você deve ser um usuário registrado para adicionar um comentário aqui. Se você já estiver registrado, faça logon. Se você ainda não estiver registrado, registre-se e faça logon.