Free Trial

Repositorio de Retos

¡Resuelve el reto, comparte tu solución y asciende en las jerarquías de nuestra Comunidad Alteryx!

Reto Semanal #62: Extrae la información relevante de un código HTML

MarieC
Alteryx Alumni (Retired)

Puedes encontrar la solución al reto de la semana pasada aquí

 

 

¡Hola! 

 

giphy .gif

Este reto me encanta porque es super útil para extraer información de paginas web de manera efectiva y rápida.  

 

Una de las características de la herramienta de Descargar de Designer es que puede extraer el código HTML sin procesar de una página web. Esta práctica a veces denominada “Web Scraping”, o raspar la Web, es útil cuando hay datos incrustados en la página a la que desea acceder desde Alteryx. El desafío es que el HTML sin procesar debe analizarse para preparar los datos para su uso. 

 

Caso Práctico:  

Queremos crear una base de datos con los mejores médicos en el área metropolitana de Denver. Una de las revistas locales de la ciudad tiene un artículo con una lista de los mejores médicos del área. 

 

Objetivo 

En la herramienta de Datos de Entrada a continuación compartimos los datos ya extraídoscon la herramienta de descarga Alteryxde la página web de la revista. Tu trabajo es separar el HTML sin procesar a el formato de salida mostrado en la Salida. 

 

¡Que se diviertan!  

@afv2688 @KarenVP @RVOrchessi @carlosteixeira @Leonela_Tacure @mariagc  @FGuerrero @JasminaAyuque  @GabrielCM @ElizaLastra @Aguisande @Leonela_Tacure @DataHabanero 

 

 

Marie-Claire Coupèrier

Aguisande
15 - Aurora
15 - Aurora

Acá les dejo mi versión.

 

Spoiler
Screenshot 2021-04-05 115127.png
afv2688
16 - Nebula
16 - Nebula

Aqui va mi solución 🙂

 

Spoiler
Untitled.png

 

Un saludo

olacey
Alteryx Alumni (Retired)

Muchas gracias por participar @Aguisande . Me encanta verte por aqui y espero verte mas seguido!! 👏

Omaira Lacey
Instructional Designer
Aguisande
15 - Aurora
15 - Aurora

Perdón, a qué te refieres?