Oi, comunidade, todos bem por ai? Hoje iremos para a segunda parte do desafio que iniciamos na semana passada, e que foi criado pelos membros da nossa comunidade @Ranyaky-Vilela , @biosartorelli , @nicolascorreiacolombo . Se ainda não fizeram o desafio anterior, aqui está o link.
Desafio:
No desafio anterior, você obteve como resultado de seu fluxo de trabalho as URLs do site do CNAE que contém as ocupações, organizadas por ordem alfabética.
Nessa semana você irá extrair dessa lista de URLs as ocupações e o número do CNAE das empresas. Crie duas colunas, uma com os nomes das empresas (ocupações), e um com o número do CNAE.
Lembre-se que você terá que fazer download de todas as URLs para trazer os dados. As ferramentas da paleta “Analisar” continuam sendo muito importantes para obter o resultado!
Prontos? Bom desafio!
Fonte dos dados: https://www.gov.br/empresas-e-negocios/pt-br/empreendedor/quero-ser-mei/atividades-permitidas
@AnaMuniz segue a minha solução abaixo. Senti falta na saída 7 CNAEs, sendo 5 deles a ocupação foi localizada mas o código não e 2 deles não foram localizados.
CNAEs nulos:
CNAEs ausentes selecionados:
Dê resto, muito legal o desafio. Quebrei a cabeça para achar o padrão e pegar os dados. Obrigado!
Bom dia @LeandroYgorLoli . Acabei de postar a solucao pra voce dar uma olhada e comparar. Eu baixei a sua solucao pra dar uma olhada, e pra mim esta aparecendo todas as CNAEs. Nao vejo nenhum campo vazio como na imagem que voce me enviou...ainda esta aparecendo vazio pra voce?