Olá pessoal, espero que todos estejam bem!
Primeiro, vamos dar boas-vindas aos estreantes do Desafio Semanal @epdrumond @Mateus sejam bem vindos!
Espero que tenham boas chances de aprender e desenvolver suas habilidades.
Segundo, quero agradecer aos nossos contribuidores da semana passada @damc @carlosteixeira @Malvim e @epdrumond. Todos vocês acertaram a quantidade de anagramas (24). Fiquem à vontade para fazer o upload de seus fluxos para que tenhamos eles em nosso histórico e outros usuários possam consultá-los futuramente.
Agora chega de blá blá blá e vamos trabalhar!
De acordo com uma pesquisa da Forbes a preparação de dados constitui, aproximadamente, 80% do trabalho de um profissional da área.
Vocês concordam/discordam? Conte um pouco da sua experiência e das barreiras que você encontra no dia a dia para ter essa etapa resolvida com eficiência. Vou adorar saber!
O desafio dessa semana traz uma situação real de um cliente (dos EUA) que possui uma base de dados com vários campos desconhecidos e registros de dados que mudam frequentemente. Nosso cliente também possui uma lista especificando os nomes dos campos, pois a ideia é que esses nomes sejam usados para agilizar o entendimento das informações. Após cada execução deste fluxo de trabalho, os 3 arquivos de entrada são alterados, o que os torna um pouco mais complicado de configurar.
Uma dica valiosa: Ao ver campos desconhecidos, pense dinamicamente!
Aproveitem para checar o artigo na base de conhecimento sobre a ferramenta Ordenar, uma das minhas queridinhas também.
Bom desafio!
Boa noite!
Não consegui deixar todas as colunas exatamente na mesma ordem que a resposta, mas consegui chegar até o final. Vou esperar as respostas do pessoal pra ver se descubro qual o segredinho!
Olá @Malvim,
Mais uma vez obrigada por sua contribuição! 🙂
Duas coisinhas...
Não tem como a ordem do seu resultado ser a mesma do output, pois esse é um fluxo dinâmico e todas as vezes que você executá-lo ele vai te gerar um resultado diferente.
Você poderia anexar seu fluxo como um pacote Alteryx no formato .yxzp? Assim, podemos ter acesso a todo pacote - dados de entrada e macros.
Obrigada!
Olá!
Segue minha proposta de solução. Não sei dizer se é a mais otimizada, mas aprendi bastante sobre as ferramentas que usei e os artigos sobre elas foram os meus melhores amigos no processo...rs.
Com relação ao pareto que o artigo menciona, em ciência de dados é bem aderente mesmo, se considerarmos a fase de "preparação" como um guarda-chuva para atividades relativas ao entendimento/ transcrição do problema e à obtenção/exploração/escolha/pre-processamento dos dados para inputar nos modelos.
A etapa que olha para o problema de negocio é determinante para para as demais e para o sucesso do projeto em si, então não faz muito sentido tentar enxugar o tempo dela. Já na etapa referente aos dados é comum atividades que envolvam repetição/iteração e, na prática, identificar e otimizar esse tipo de atividade é o que me dá margem pra diminuir o tempo gasto na preparação.
[ ]´s
Olá,
segue minha solução aqui tirando o atraso, mas fiz sem olhar nenhuma das soluções enviadas nem a resposta, pra pensar livremente sem viés.
Att,
Cristiano
Fala Galera!!! Responde 3 no dia pode pedir música no Fantástico? kkkkkk
Segue mais um pra coleção.
Abraços
@carlosteixeira Pode pedir!
Qualé a múúúúsica? 🙂
Fiquei impressionado na solução oficial! As ferramentas que são Dynamic possuem um poder incrível!
Também achei interessante o uso da macro para gerar bases dinâmicas.