Free Trial

Repositório de Desafios

Resolva o desafio, compartilhe sua solução e lidere nossa Comunidade!

Desafio #151: Extrair informações de um website (Parte 1)

AnaMuniz
Moderator
Moderator

Olá, comunidade, tudo bem por aqui?

 

Nas próximas duas semanas teremos desafios muito especiais. Eles foram criados por membros da nossa comunidade: @Ranyaky-Vilela, @biosartorelli e @nicolascorreiacolombo, e abordam um problema real que eles conseguiram resolver criando um fluxo de trabalho no Alteryx Designer!

 

Vocês já precisaram de alguma informação que está em um site, mas ela não está disponível para download? O desafio consiste em realizar o download e listar todas as ocupações e classificações nacionais de atividades econômicas (CNAEs). Vamos criar um fluxo de trabalho para que você não precise tabular manualmente as informações! Hoje faremos a primeira parte.

 

Desafio:

No desafio dessa semana, você deverá encontrar um padrão do código HTML e extrair os links de todas as páginas de A a Z. Isso é o primeiro passo para que no desafio da semana que vem você encontre as informações de cada página.

Credit: PexelsCredit: Pexels

 

Dica: a ferramenta Baixar (Download) e as ferramentas de Análise de dados serão importantes para seu fluxo dar certo!

 

Fonte dos dados: https://www.gov.br/empresas-e-negocios/pt-br/empreendedor/quero-ser-mei/atividades-permitidas

LeandroYgorLoli
Bólide

Segue minha solução:

Saqueador
LeandroYgorLoli_0-1669395303959.png