Free Trial

Blog - Português

Insights e ideias das mentes mais brilhantes em análise de dados.
FláviaB
Community Manager
Community Manager

2021.1_CommunityBanner_1300x233px_Blank-01.png

na Comunidade em inglês  

 

Recebemos o seu feedback e uma coisa ficou clara: um Citizen Data Scientist não tem uma função única, com um conjunto de habilidades predefinidas, mas sim um espectro de funções com níveis de especialização e necessidades analíticas variadas. Para que você atenda as necessidades de qualquer função que esteja exercendo, nós adicionamos quatro novas ferramentas de aprendizado de máquina no Alteryx Intelligence Suite: Saúde dos Dados, AutoML, Tipos de Recurso e Criar Recursos. Três delas (AutoML, Tipos de Recurso e Criar Recursos), foram desenvolvidas por nós com as bibliotecas de ciência de dados dos nossos laboratórios de inovação. Agora você pode utilizar todo o poder desses pacotes open-source de Python em um fluxo de trabalho do Alteryx. A quarta é uma ferramenta nova que ajuda a avaliar rapidamente a qualidade das suas informações antes de treinar o seu modelo.

Saúde dos Dados

Quer você esteja começando a sua jornada como Citizen Data Scientist ou simplesmente querendo simplificar o seu pipeline de aprendizado de máquina, a ferramenta Saúde dos Dados é a melhor opção.  A ferramenta Saúde dos Dados permite verificar o estado das informações para a modelagem preditiva.

FláviaB_0-1612983505527.png

Ela fornece insights sobre o seu conjunto de dados, concentrando-se em seis métricas: valores ausentes, exclusividade, dispersão, campos unários (como IDs) e outliers. Assim você pode corrigir os problemas dos seus dados, criando o melhor modelo logo na primeira tentativa. A configuração é simples: você só precisa decidir se quer as suas pontuações normalizadas (0-1) ou em porcentagem (0-100%) e a ferramenta as fornece com base nas seis métricas. Quer saber mais? Consulte os documentos de ajuda aqui.

 

FláviaB_1-1612983505542.png

 

Tipos de Recurso e Criar Recursos

Se você está em um nível mais avançado (confortável utilizando a modelagem assistida) e quer enriquecer os seus tipos de dados ou gerar novos recursos, utilize as ferramentas Tipos de Recurso e Criar Recursos de forma combinada, levando os seus modelos para um novo patamar.

FláviaB_2-1612983505543.png

A ferramenta Tipos de Recurso detecta tipos de dados aprimorados. Os tipos aprimorados são versões sofisticadas dos tipos de dados normais. Por exemplo, um número de cinco dígitos seria caracterizado como numérico no tipo de dados básico. Entretanto, no tipo de dados aprimorado, ele pode ser detectado como um código postal dos EUA. Por padrão, quando você executa o fluxo de trabalho, a ferramenta Tipos de Recurso detecta automaticamente os tipos aprimorados no campo de dados. Você pode substituir o tipo detectado automaticamente, especificando o tipo de dados na coluna Alterar tipo.

A ferramenta Tipos de Recurso é uma entrada obrigatória para que a ferramenta Criar Recursos execute uma engenharia eficaz. Ela também é uma entrada opcional para que a ferramenta Saúde dos Dados aprimore a saída do relatório.

FláviaB_3-1612983505544.png

 

A ferramenta Criar Recursos cria automaticamente novos recursos a partir dos dados existentes. Isso ajuda a

formatar as suas informações de um jeito que o modelo de aprendizado de máquina possa analisá-las, aumentando as chances de encontrar padrões significativos. Isso ajuda a encontrar variáveis que talvez você não tenha considerado (ou priorizado). Por exemplo, você pode transformar uma coluna de "datas de nascimento" em novos recursos, como "idade" ou "mês do aniversário".

 

FláviaB_4-1612983505554.png

 

AutoML

FláviaB_5-1612983505555.png

Depois de garantir a qualidade dos seus dados e passar para a modelagem, você pode querer agendar o treinamento do modelo no Alteryx Analytics Hub ou no Server. Todas as ferramentas de aprendizado de máquina do Intelligence Suite funcionam muito bem nos fluxos hospedados no Hub e no Server. Agendar o treinamento de modelos periodicamente é uma ótima maneira de mantê-los com o desempenho máximo.

 

Porém, o que acontece se a expectativa é de que as suas informações de treinamento mudem bastante com o tempo? Nesse caso, você pode querer ter a flexibilidade de atualizar automaticamente o algoritmo do seu modelo para que ele se adapte aos seus dados de treinamento mais recentes. Por exemplo, passar de um modelo de floresta aleatória para um modelo XGBoost em vez de manter o algoritmo que você selecionou quando criou o fluxo de treinamento pela primeira vez (por exemplo, ajustando sempre um modelo de floresta aleatória).

 

Nós criamos uma ferramenta perfeita para esse caso, tão fácil de utilizar quanto a Modelagem Assistida. A ferramenta AutoML permite que você treine um modelo sem a interface pop-up da Modelagem Assistida e ainda selecione de forma inteligente o melhor algoritmo. Embora a ferramenta AutoML não ofereça a experiência guiada da Modelagem Assistida, ela tem o mesmo poder da biblioteca de modelagem automática EvalML em uma única ferramenta Alteryx. Para utilizar a ferramenta AutoML, basta selecionar a variável-alvo. A partir daí, o método de aprendizado de máquina é configurado automaticamente com base na estimativa do modelo. Você pode substituí-lo selecionando manualmente o método de aprendizado de máquina.

 

Essa ferramenta também pode ser útil para usuários muito avançados que queiram criar rapidamente modelos eficazes de aprendizado de máquina, diretamente em um fluxo de trabalho ou criar aplicativos analíticos que selecionam um novo modelo treinado a cada execução.

Experimente você mesmo

A equipe de inovação em ciência de dados trabalhou arduamente para integrar a propriedade intelectual do FeatureLab ao Alteryx Intelligence Suite. Você pode baixar o kit de início do Intelligence Suite hoje mesmo para explorar modelos com amostras de dados, fluxo de trabalho e caso de uso. Disponível no Designer versão 2021.1 com uma licença do Alteryx Intelligence Suite (entre em contato com o seu representante!). Para facilitar o início da sua jornada, disponibilizamos amostras de fluxos de trabalho para essas novas ferramentas (Ajuda > Exemplos de fluxos de trabalho > Aprenda um modelo de cada vez). Você também pode consultar este post para obter um exemplo detalhado de como utilizar as novas ferramentas.

 

 

Rótulos