Olá, comunidade, tudo bem? Prontos para mais um desafio semanal?
Em análise de dados, não recomendamos usar muitas ferramentas Junção cruzando umas com as outras, porque isso pode gerar grandes quantidades de dados (e complicar muito a vida do analista...); no entanto, há certos casos em que isso é necessário. Vamos trabalhar nisso no de
safio dessa semana.
Uma empresa vende moveis para dormitórios. Quando as estruturas de uma cama são vendidas por exemplo, há peças necessárias que as acompanham para sua montagem (porcas, parafusos, rodízios etc.). O fabricante destas peças envia os produtos em embalagens separadas. Eles etiquetam as embalagens, mas depois a transportadora nos EUA adiciona as suas próprias etiquetas à caixa, a Alfândega dos EUA adiciona uma nova etiqueta, e a empresa transportadora no Brasil adiciona outra etiqueta... Já perceberam a confusão?
Agora está difícil determinar quais embalagens pertencem ao mesmo produto (quais são para camas, quais para armários
). O seu desafio é identificar que embalagens pertencem ao mesmo produto. Para fazer isso, você precisa de encontrar os pacotes com etiquetas que correspondam umas com as outras.
Utilizando os dois conjuntos de dados (um para estrutura de camas, outro para acessórios), crie um fluxo de trabalho pa
ra determinar quais os pacotes devem ir juntos. Para resolver este desafio, é necessário calcular o número total de correspondências.
Dica: a etiqueta A1 aparece em ambas as listas.
PS: os dados estão em inglês.