Connexion à Hadoop | Alteryx 11,0
Produit: Alteryx designer et Alteryx Server
VERSION: 11,0
Dernière mise à jour: 2/15/2017
Pièce jointe: aucun
Connexion à Hadoop dans Alteryx 11,0
Dans cet article, nous irons sur la façon de se connecter aux différentes saveurs de Hadoop dans Alteryx 11,0.
Les workflows créés avant Alteryx 11,0 qui incluent des outils connectés à Hadoop doivent maintenir la connexion sans problème. Les alias sont maintenant appelés «connexions de données sauvegardées» et seront également reportés.
Pour utiliser une connexion de données enregistrée pour se connecter à une base de données, utilisez l'option "connexions de données sauvegardées" dans l'outil données d'entrée, puis accédez à la connexion que vous souhaitez utiliser:
Note: Alteryx 11,0 inclut la fonctionnalité pour gérer les connexions de données à travers la Galerie ainsi que via Options > Options avancées > gérer les connexions de données. Les alias créés dans les versions antérieures seront reportés en tant que connexions stockées sur l'ordinateur local.
Création d'une nouvelle connexion à HDFS
1. Apportez un outil d'entrée sur le canevas et accédez à l'option Hadoop.
Sélectionnez la petite flèche sous "connecter un fichier ou une base de données", puis Hadoop.
2. Saisissez les informations nécessaires pour vous connecter
Votre HDFS/Hadoop admin/it Contact devra fournir le nom d'hôte à utiliser ainsi que la méthode de connexion (HTTPFS, WebHDFS, ou Knox Gateway), et le nom d'utilisateur et mot de passe (si nécessaire). Alteryx fournit le port par défaut. Si votre entreprise utilise un autre port, vous devrez éditer ceci ici:
Alteryx utilise l'hôte et le port pour générer l'URL à utiliser pour la connexion. Vous avez également la possibilité de modifier l'URL si cela est nécessaire.
Cliquez sur "test" pour vérifier la connexion pour vous assurer qu'il fonctionne.
3. Cliquez sur OK et sélectionnez le fichier à lire dans
Cliquez sur "OK" pour ouvrir une nouvelle fenêtre avec tous les fichiers disponibles dans HDFS (Remarque: Alteryx prend actuellement en charge les fichiers .csv et Avro dans HDFS). Vous pouvez soit entrer le nom du fichier manuellement, soit utiliser la fonctionnalité parcourir pour naviguer vers le fichier.
Création d'une connexion de données enregistrée pour HDFS
Une fois que vous avez réussi à établir une connexion à HDFS, vous devez enregistrer la connexion pour une utilisation ultérieure. La façon la plus simple de le faire est la suivante:
1. Copiez la chaîne de connexion maintenant visible dans l'outil d'entrée
2. Ouvrir le gestionnaire de connexions de données
Aller à options > options avancées > gérer les connexions de données et sélectionnez Ajouter une connexion
3. Entrez un nom de connexion et une chaîne de connexion et appuyez sur Enregistrer
4. La connexion HDFS sera maintenant disponible dans les deux outils d'entrée et de sortie à utiliser dans les connexions de données sauvegardées
Création d'une nouvelle connexion à Hive/Impala/Spark
Pour vous connecter à Hive/Impala/Spark, un pilote ODBC est requis et peut être téléchargé à partir de la page de téléchargement des pilotes Alteryx.
Une fois le pilote téléchargé, un nouveau DSN doit être configuré via l'administrateur de sources de données ODBC de Windows (panneau de configuration > système et sécurité > outils d'administration > sources de données (ODBC)). Votre HDFS/Hadoop admin/IT contact pourrait avoir besoin de fournir les noms d'hôtes nécessaires/informations d'identification de l'utilisateur/etc. pour se connecter.
Une fois qu'un DSN a été configuré et testé via l'administrateur de la source de données, vous êtes prêt à vous connecter via Alteryx.
1. Ajoutez un nouvel outil d'entrée à la zone de dessin et accédez aux connexions ODBC.
Sélectionnez la petite goutte vers le bas comme vous l'avez fait pour la connexion HDFS, puis accédez à d'autres bases de données > ODBC
2. Sélectionnez le nom de la source de données
Dans la fenêtre de connexion ODBC, sélectionnez le DSN qui a été configuré via l'administrateur de sources de données ODBC de Windows et saisissez le nom d'utilisateur/mot de passe au besoin.
3. Entrez/Construisez votre requête
Utilisez les onglets tables, Visual Query Builder ou SQL Editor pour créer la lecture de la requête dans les données de Hadoop à Alteryx.
Remarque: en tant que nouvelle fonctionnalité de Alteryx 11, le générateur de requêtes visuelles ne se charge pas automatiquement pour toutes les bases de données, car il peut être lent à charger (par exemple, de grands schémas dans la ruche).
Création d'une connexion de données enregistrée pour les connexions ODBC à Hive/Impala/Spark
1. Ouvrir le gestionnaire de connexions de données
Aller à options > options avancées > gérer les connexions de données et sélectionnez Ajouter une connexion
2. Entrez un nom de connexion et sélectionnez ODBC comme type de connexion
3. Sélectionnez le nom de la source de données
Dans la fenêtre de connexion ODBC, sélectionnez le DSN qui a été configuré via l'administrateur de sources de données ODBC de Windows et saisissez le nom d'utilisateur/mot de passe au besoin.
4. La connexion sera maintenant disponible dans les deux outils d'entrée et de sortie à utiliser dans les connexions de données sauvegardées Connexion à Hadoop HDFS/Hive/Impala/Spark avec Alteryx 11,0. 11,0
Afficher l'article complet