Olá, comunidade, tudo bem por aqui?
Nas próximas duas semanas teremos desafios muito especiais. Eles foram criados por membros da nossa comunidade: @Ranyaky-Vilela, @biosartorelli e @nicolascorreiacolombo, e abordam um problema real que eles conseguiram resolver criando um fluxo de trabalho no Alteryx Designer!
Vocês já precisaram de alguma informação que está em um site, mas ela não está disponível para download? O desafio consiste em realizar o download e listar todas as ocupações e classificações nacionais de atividades econômicas (CNAEs). Vamos criar um fluxo de trabalho para que você não precise tabular manualmente as informações! Hoje faremos a primeira parte.
Desafio:
No desafio dessa semana, você deverá encontrar um padrão do código HTML e extrair os links de todas as páginas de A a Z. Isso é o primeiro passo para que no desafio da semana que vem você encontre as informações de cada página.
Dica: a ferramenta Baixar (Download) e as ferramentas de Análise de dados serão importantes para seu fluxo dar certo!
Fonte dos dados: https://www.gov.br/empresas-e-negocios/pt-br/empreendedor/quero-ser-mei/atividades-permitidas
Segue minha solução: