Free Trial

Base de conhecimento

Domínio de Ferramentas | Python

FláviaB
Alteryx Community Team
Alteryx Community Team
Created

Python.pngEste artigo faz parte da série Domínio de Ferramentas, uma compilação de contribuições da Base de Conhecimento para apresentar diversos exemplos para as ferramentas do Designer. Vamos nos aprofundar nos usos da ferramenta Python como parte da nossa jornada para dominar o Alteryx Designer: 

 

Python é uma das linguagens de programação que mais cresce no mundo, sendo usada por uma ampla variedade de aplicativos que abrangem da manipulação básica de dados à ciência de dados e desenvolvimento de software. Com o lançamento da versão 2018.3, havia chegado a tão esperada ferramenta Python! Muito semelhante à ferramenta R, ela permite executar código de maneira perfeitamente integrada ao seu fluxo de trabalho do Alteryx. Também como ocorre com a ferramenta R, você precisa ter alguma experiência com código na linguagem referida para usar o todo o potencial da ferramenta. Neste artigo da série Domínio de Ferramentas, vamos apresentar os princípios básicos de uso da ferramenta Python.

 

Ao trazer a ferramenta Python para a tela pela primeira vez, você verá a imagem abaixo na janela de configuração da ferramenta. É um lembrete para executar o fluxo de trabalho sempre que conectar a ferramenta Python a uma nova fonte de dados de entrada. Isso coloca os dados de entrada na ferramenta para que você possa inseri-los em seu código Python.

 

1.png

 

Como o texto diz, para que a interface do Jupyter Notebook comece a funcionar, você precisa apenas esperar. São necessários somente alguns segundos para que ela apareça na primeira vez que você abre uma ferramenta Python no Designer. Aquela primeira mensagem é então substituída pela interface do Jupyter Notebook.

 2.png

 

Para ter uma visão geral sobre o Jupyter, confira o Guia de Introdução deles. 

 

A primeira etapa para usar a ferramenta Python é importar o pacote de API do Alteryx, o que permite que você transfira dados entre o Alteryx Engine e a ferramenta Python. Se você pretende ler dados do Alteryx Engine ou extrair dados dele a partir da ferramenta Python, seu código deve começar com:

 

from ayx import Alteryx

 

Esse fragmento de código é tão fundamental que é preenchido automaticamente na primeira célula da ferramenta Python!

 

3.png

 

Para executar uma célula individual na ferramenta, você pode clicar no botão de reprodução na barra superior da janela de configuração ou usar o atalho de teclado shift + return.

 

4.png

 

Além do pacote ayx, a ferramenta Python vem com alguns pacotes Python carregados por padrão. Esses pacotes estão listados na documentação de ajuda e são relacionados principalmente à ciência de dados. Também há um ótimo artigo que descreve a funcionalidade de cada um desses pacotes pré-instalados. Para carregar um pacote que já está instalado, você pode usar o comando "import", como faria ao criar um script Python fora do Alteryx. Se quiser instalar uma biblioteca Python que não está incluída por padrão na ferramenta, pode usar a função Package.installPackages().

 5.png

 

O asterisco * que aparece no lugar do número da célula indica que a célula está em execução.

 

Quando um pacote é instalado com êxito, você vê mensagens relacionadas às dependências e à versão do pacote instalado, algo parecido com isto:

 

6.png

 

 

Se você quiser acompanhar a demonstração a seguir, baixe o conjunto de dados iris.yxdb anexado a este artigo! 

 

Se você está trazendo dados por meio da âncora de entrada no Alteryx, é necessário executar o fluxo de trabalho para disponibilizar esses dados para o Jupyter Notebook. Depois de executar o fluxo de trabalho, você pode usar a função Alteryx.read() para trazer os dados para o Python.

O único argumento dessa função é a conexão específica que você quer ler. Como na ferramenta R, esse argumento é uma cadeia de caracteres e precisa estar entre aspas.

7.png

Para ler esse fluxo de dados, o código seria:

 

data = Alteryx.read("#1")

 

8.png

 

Se você tentar ler os dados antes de executar todo o fluxo de trabalho, provavelmente verá este erro de arquivo não encontrado:

 

9.png

 

A solução é salvar o fluxo de trabalho e executá-lo. Da próxima vez que você usar o botão de reprodução para executar o código na célula, o erro provavelmente será resolvido.

 

Tudo o que for lido na ferramenta Python será lido como um quadro de dados do pandas. Isso permite maior flexibilidade para processar os dados no Python. Você pode alterar o formato dos dados depois da leitura, mas precisará retornar todas as saídas de volta a um quadro de dados do pandas.

 

Agora que já inseri meus dados, vou analisá-los. Primeiro, vou criar uma nova célula clicando no ícone de adição ao lado do botão para salvar/criar um ponto de verificação. Ou eu poderia usar o atalho de teclado B para adicionar uma célula abaixo da célula atual.

 

10.png

 

 

Nessa mesma barra de ferramentas, ao lado do botão para inserir célula abaixo, você encontra outras funções úteis de célula e notebook. Da esquerda para a direita, os botões executam as seguintes ações: salvariconesalvar.png,  adicionar uma célula 11.png,  cortar célula(s)12.png,  copiar célula(s) 13.png,  colar célula(s) 14.png,  mover célula(s) para cima 15.png,  mover célula(s) para baixo 16.png,  executar 17.png,  interromper 18.png,  reiniciar o kernel 19.png  e, por último, reiniciar o kernel e executar o Notebook novamente 20.png. Todos esses botões têm atalhos de teclado associados. Você pode ver uma lista completa dos atalhos de teclado do Jupyter Notebook em Help > Keyboard Shortcuts, no menu superior.

 

 

Para esta demonstração, eu quero executar uma análise de cluster no conjunto de dados "iris". Então, na nova célula, vou carregar a função KMeans do módulo Scikit-Learn para Python (incluído na instalação da ferramenta Python do Alteryx) e escrever um código simples para criar clusters e imprimir os rótulos de clusters resultantes.

 

21.png

 

Agora, eu consigo visualizar meus clusters com a biblioteca python matplotlib.pyplot (também incluída com a ferramenta Python por padrão).

 

22.png

 

Por fim, é possível gerar uma saída a partir da ferramenta Python usando a função Alteryx.write(). No momento, essa função tem suporte apenas para quadros de dados do pandas. Se você tentar gravar algo que não seja um quadro de dados, receberá o seguinte erro:

 

23.png

 

Esse erro pode ser resolvido convertendo a saída em um quadro de dados do pandas. Se você não está familiarizado com os quadros de dados do pandas, confira esta apresentação sobre estruturas de dados do pandas ou este site que dá uma introdução ao pandas em 10 minutos. Depois de gravar o código com Alteryx.write() na ferramenta Python, você precisa executar todo o fluxo de trabalho para ver os resultados nas âncoras de saída da ferramenta.

 

24.png

 

Depois de executar o fluxo de trabalho, os resultados são preenchidos na âncora de saída 1 da ferramenta Python.

 

Com essa visão geral, espero que você já se sinta mais confiante para ler, gravar e processar dados na ferramenta Python. Agora, sua imaginação é o limite!

 

 

Informações importantes e atualizações:

 

  • A partir da versão 2018.4, você pode carregar Jupyter Notebooks e scripts Python criados externamente.
  • Os metadados não serão preenchidos de maneira consistente em ferramentas de etapas posteriores para dados que saem da ferramenta Python.
  • Há uma conversão de tipos implícita de booleano (Bool) para número inteiro (Int) ao ler dados na ferramenta Python. Da mesma forma, há uma outra conversão de tipos implícita de booleano (Bool) para número inteiro (Int) ao fazer a saída dos dados da ferramenta.
  • A partir da versão 2018.4, você tem a capacidade de definir os tipos de dados das colunas ao gerar uma saída.
  • No momento, apenas quadros de dados do pandas têm suporte para leitura e gravação. No momento, não é possível gravar um diagrama, nem ler e gravar objetos espaciais.
  • Também ainda não há suporte para constantes de perguntas.

 

Se você deseja nos dar seu feedback sobre a ferramenta, poste na nossa página de ideias sobre os produtos! Nossos gerentes de produto são bastante presentes aqui e adorariam ouvir ideias de novos recursos ou as limitações que você encontrou na ferramenta.

 

A esta altura, você já deve ter a proficiência de um expert na ferramenta Python! Agora, se você já é um especialista em outras ferramentas do Designer, contribua para o Blog da Comunidade compartilhando suas experiências e nos contando como e para que você usa as nossas ferramentas no seu dia a dia. Se tiver interesse em contribuir com um blog, envie um e-mail para flavia.brancato@alteryx.com para ter acesso à seção.

 

Toda segunda-feira vamos trazer uma ferramenta nova para a nossa seleção. Com isso, adoraríamos saber qual é a sua favorita ou qual ferramenta você gostaria de ver aqui na Comunidade na próxima semana. Não esqueça de se inscrever no painel da Base de Conhecimento para ser notificado das novidades!

 

*Este texto é uma adaptação do artigo original escrito por @SydneyF na Comunidade em inglês

Anexos
Comentários
Thableaus
17 - Castor
17 - Castor

Vou tentar escrever mais sobre essa ferramenta Python para ajudar os iniciantes. Dá pra fazer integração demais usando os dois, combinação perfeita!

Contribudores
Rótulos