Base de Connaissance - Français

Apprenez auprès des experts.
Applications analytiques chaînées Alteryx Alteryx applications analytiques (Apps) sont très utiles. Ils nous permettent de prendre un processus, paramétrer des parties de celui-ci, et ajouter une interface afin que les utilisateurs finaux n'ont pas besoin de connaître tous les rouages du processus afin de le faire fonctionner pour leur scénario spécifique. Nous pouvons même prendre un $ $ etAPP et le publier à une galerie de Alteryx ainsi le processus peut être partagé avec quelqu'un qui n'a même pas Alteryx installé sur leur machine. Une question commune que nous entendons des constructeurs de $ $ etAPP est, «comment faire les choix présentés pour une question d'interface dépendent d'une question d'interface précédemment répondue?». Ceci est principalement accompli en enchainant plusieurs apps ensemble de sorte que les résultats de l'application #1 fournissent dynamiquement les options pour une question déroulante ou de ListBox dans l'application #2. L'étape 1 et l'étape 2 du paquet ci-joint fournissent un exemple. Que faire si la question que vous souhaitez mettre à jour n'est pas une liste déroulante ou ListBox? Vous pouvez réellement employer l'application #1 pour mettre à jour dynamiquement le XML brut contrôlant la question (ou n'importe quel outil) dans l'application #2 avant de présenter les questions de l'application #2 à l'utilisateur. L'étape 2 et l'étape 3 du paquet ci-joint fournissent un exemple. Moins souvent, on nous demande comment nous pouvons créer ce que j'aime appeler une «boucle de rétroaction» dans l'interface. Cela implique l'utilisateur de l'application remplissant un ensemble de questions, en voyant certains résultats de ces questions, et de décider s'il faut continuer à avancer ou revenir à modifier leurs sélections initiales. Ceci peut être accompli en utilisant la même idée de modifier le XML pour décider dynamiquement quel $ $ etAPP devient le prochain lien de la chaîne dans un processus. L'étape 3 dans le paquet ci-joint est un exemple qui sera soit passer à une véritable étape 4 si l'utilisateur est heureux avec les résultats des étapes 1-3 ou sera en boucle de retour à l'étape 2 afin que l'utilisateur peut modifier leurs sélections initiales. Ils peuvent continuer dans la boucle, en modifiant leurs sélections à l'étape 2 encore et encore jusqu'à ce qu'ils soient satisfaits des résultats et choisissent de passer à l'étape 4. Le package joint (créé à l'aide de Alteryx 10) contient un exemple pour chacune de ces options avec quelques notes appelant les différents exemples. Veuillez noter que les deux options impliquant la modification du XML d'un $ $ etAPP ne fonctionneront pas dans une galerie de Alteryx parce que n'importe quelle application exécutée par la Galerie doit être vérifiée par le serveur à l'avance et il n'y a aucun moyen de construire cette étape de vérification dans l'application. 10,0
Afficher l'article complet
Est-ce qu'Alteryx peut analyser un document Word ou un PDF? Une des principales raisons pour lesquelles les gens aiment Alteryx, est la possibilité de lire un grand nombre de source de données différentes. Une limitation est qu'il ne peut pas lire dans un PDF ou un document Word sans l'aide d'une autre source. Pourquoi vouloir faire cela ? Un parfait exemple serait d'analyser un dossier rempli de CV à la recherche d'un texte spécifique. Pourquoi Alteryx ne peut-il pas lire ces formats nativement ? Il ne s'agit pas de format standard, donc afin de les lire, nous devons d'abord les convertir en texte brut. Pour la conversion, il existe un programme gratuit, open source, appelé DocToText. Ce programme peut être exécuté à partir de la ligne de commande pour convertir ces types de fichiers en texte brut, lisible par Alteryx sans problème. J'ai attaché un exemple à ce poste. Ce module utilise un outil souvent sous-utilisé, l'outil exécuter une commande. Avec l'aide de cet outil, nous pouvons lire dans une liste de fichiers à partir d'un dossier source spécifique, analyser les informations dans un format utilisable par DocToText, puis convertir les fichers en texte via l'outil exécutez une commande. J'ai inclus tout ce dont vous aurez besoin dans la pièce jointe (y compris un exemple de fichier PDF et l'exécutable). Téléchargez et ouvrez le fichier yxzp ci-joint, consultez le module, et faites-nous savoir ce que vous pensez ! Vous remarquerez que le paquet produira des erreurs de dépendance de couple lors de l'ouverture. C'est normal! Il n'y aura pas d'erreur lors de l'exécution. Un merci spécial à Maureen Wolfson pour l'application de base et les suggestions ! A bientôt ! ~ Chad Suivez-moi sur Twitter! @AlteryxChad 10,0
Afficher l'article complet
Profilage des données dans l'outil parcourir | Alteryx 11,0 Produit: Alteryx designer et Alteryx Server VERSION: 11,0 Dernière mise à jour: 02/13/2017 Pièce jointe: aucun Bienvenue à Alteryx 11.0 nouvelle fonctionnalité de profilage de données dans l'outil de navigation. Nous sommes enthousiastes à ce sujet et nous espérons que vous serez trop! Le profilage de données dans l'outil de navigation a été créé pour aider l'utilisateur à mieux comprendre la qualité de ses données à tout moment dans le Workflow. Cette option aidera les utilisateurs à comprendre la qualité de leurs données, à faciliter le dépannage et à résoudre les problèmes qui peuvent survenir lors de la tentative d'analyse, de jointure ou de sortie de leurs données. Comment fonctionne le profilage des données: Ajoutez un outil de navigation après n'importe quel outil que vous voulez vérifier la qualité de vos données. Nous recommandons fortement d'entrer dans l'habitude d'ajouter un outil de navigation après vos entrées. Cela vous permettra de comprendre tout de suite la chauve-souris ce que l'état de vos données est en. Vous pouvez ensuite exécuter le workflow et sélectionner l'outil parcourir. La fenêtre de configuration affiche des graphiques relatifs à chacune de vos colonnes dans vos données, ainsi que des informations spécifiques sur le champ et le type de données. En sélectionnant une colonne spécifique dans votre fenêtre de résultats, le profilage des données dans la fenêtre de configuration vous indiquera la qualité des données dans cette colonne. Vous recevrez des graphiques et des informations différents selon le type de données dans le champ. S'il vous plaît voir notre merveilleux document d'aide en ligne pour l'outil de navigation qui contient toutes les informations sur les graphiques et les métadonnées, cliquez sur Afficher les données sur la page pour en savoir plus. Nous avons également une courte vidéo qui vous accompagnera dans le profilage des données. Trucs et astuces: L'outil parcourir ne restituera le profilage des données que lorsque l'outil de navigation est sélectionné. En fonction de la quantité de données que vous exécutez dans l'outil parcourir, il peut prendre un peu de temps pour l'outil parcourir pour restituer les rapports de profilage de données. Si vous ne sélectionnez pas l'outil parcourir lorsque vous travaillez dans le workflow, il n'utilisera pas de mémoire tant que vous n'aurez pas sélectionné l'outil parcourir pour restituer les rapports. Si vous souhaitez capturer ces données et utiliser les données dans un workflow ou extraire ces informations, vous pouvez utiliser l'outil de profil de données de base. Cet outil récupère les informations du profilage de données dans l'outil parcourir. En ce moment, nous n'avons pas la possibilité d'exporter les graphiques. Vous pouvez désactiver la fonction de profilage des données en allant à vos paramètres utilisateur et décochez la case "collecter et afficher les informations de profils de données". Cependant, comme recommandé plus haut dans l'article, l'utilisation du profilage des données après que votre outil de données d'entrée est maintenant considéré comme la meilleure pratique et au moins le profilage des données doit être utilisé à ce stade. Vous pouvez toujours désactiver l'option après avoir examiné vos données. Bienvenue à Alteryx 11,0 nouvelle fonctionnalité de profilage de données dans l'outil de navigation. Nous sommes enthousiastes à ce sujet et nous espérons que vous serez trop! Le profilage de données dans l'outil de navigation a été créé pour aider l'utilisateur à mieux comprendre la qualité de ses données à tout moment dans le Workflow. Cette option aidera les utilisateurs à comprendre la qualité de leurs données, à faciliter le dépannage et à résoudre les problèmes qui peuvent survenir lors de la tentative d'analyse, de jointure ou de sortie de leurs données. 11,0
Afficher l'article complet
Chaînage des workflows ensemble Nous recevons tout à fait quelques questions sur la façon de chaîner correctement les workflows ensemble. Nous avons quelques options qui dépendent de ce type de Alteryx que vous utilisez. Si vous avez le concepteur seulement, vos options sont d'utiliser les macros d'équipage qui sont trouvées sur la communauté. Aucun lien fourni à mesure que les outils sont mis à jour. Veuillez utiliser la recherche communautaire pour les dernières macros d'équipage. Dans l'ensemble des macros de l'équipage, les outils que vous allez chercher à utiliser sont les outils Runner. Vous pouvez trouver une description des outils ici outils Runner. Remarque: vous devrez créer un autre workflow à l'aide de ces macros pour exécuter les workflows. Si vous avez designer with Scheduler ou Alteryx Server, vous pouvez utiliser les macros de l'équipe sur le planificateur, mais ils ne sont pas en mesure d'être utilisés dans la Galerie. Vous avez d'autres options qui vous permettront de ne pas avoir à construire un autre workflow en utilisant les outils Runner et utiliser le workflow sur la galerie ou planificateur. Lorsque vous disposez d'un planificateur ou d'un serveur, vous avez accès à la commande Alteryx Engine. Cela permettra à Alteryx d'exécuter des workflows via la ligne de commande pour exécuter des workflows ou des programmes supplémentaires. Dans la plupart des cas, le AlteryxEngineCmd sera situé dans C:/Program Files/Alteryx/bin/AlteryxEngineCmd.exe. Super, alors qu'est-ce que je fais avec? Dans votre fenêtre de configuration de workflow, vous disposez d'un onglet appelé événements. Dans cet onglet, vous pouvez ajouter un événement de commande Run. Vous pouvez choisir d'exécuter la commande comme: Dans la commande: vous pouvez soit naviguer à votre AlteryxEngineCmd ou tapez dans l'emplacement comme so-c: Program Files Files/Alteryx/bin/AlteryxEngineCmd.exe Dans les arguments de commande [facultatif]: vous allez ajouter l'emplacement du 2ème Workflow avec le nom du workflow et du type de fichier. exemple: «C:/temp/NHL2. YXMD " Très important: Notez dans l'exemple ci-dessus que nous avons des citations autour de la chaîne. La raison en est que la commande a des difficultés avec les espaces dans les chemins d'accès au répertoire. En mettant des guillemets autour de la chaîne, cela indique à la commande d'ignorer essentiellement les espaces. Cependant, la meilleure pratique est de ne pas avoir des espaces dans vos chemins d'accès au répertoire lors de l'utilisation de cette commande. Échantillon: Note: cette méthode est une grande méthode, mais peut être capricieux. Si vous exécutez un autre processus de commande ou si vous n'avez pas d'accès admin aux dossiers, il peut provoquer des problèmes. Vous avez également une autre option! Vous pouvez transformer vos workflows en applications pour l'utilisation de la galerie ou du planificateur et les exécuter consécutivement. Lorsque vous faites glisser un outil d'interface sur la zone de travail, votre workflow va automatiquement passer à une application. Si vous ne souhaitez pas utiliser un outil d'interface, vous pouvez toujours modifier le workflow en une application pour utiliser l'option d'application chaînée. Une fois que vous modifiez le workflow en une application, vous pouvez utiliser la fenêtre concepteur d'interface pour enchaîner les applications ensemble. Remarque: lors de la création de workflows enchaînés à utiliser dans le planificateur et la Galerie, les workflows et les actifs du Workflow doivent être placés sur le serveur. En outre, le serveur doit avoir accès à toutes les connexions de base de données, répertoires de fichiers et les fichiers d'entrée. Vous voulez en savoir plus sur le concepteur d'interface? Interface-designer-partie-1 Voulez-vous programmer les workflows pour qu'ils s'exécutent de suite? Consultez cet article-planification-workflows-utilisation-Event-Run-commande Apps
Afficher l'article complet
Alteryx types de données 101 Lorsque vous apportez des données dans Alteryx beaucoup d'utilisateurs ajoutent souvent un outil de sélection pour vérifier le type de données et la structure. Les types de données sont très importants en raison des opérations/fonctions disponibles dans les outils peuvent être ajustés pour s'adapter au type de données utilisé! Par exemple, lors de l'utilisation des champs de chaîne de l'outil de filtrage de base seront remplis dans des opérateurs de chaîne tels que'Equals'ou'Contains'alors que, un champ numérique avec des opérateurs tels que'>> ='ou'''. Comment vérifier/modifier vos types de données? Outil de champ automatique Utilisez l'outil champ automatique pour évaluer votre jeu de données sur chaque Run et laissez Alteryx décider de ce que le type et la taille devrait être. Comme ou si vos données changent l'outil de champ automatique ajustera le type et la taille qu'il définit. Cela est particulièrement utile lorsque vous cherchez à accélérer le traitement des données, car Alteryx cherchera à assigner la taille la plus efficace et le type de données. Cet outil ne sera pas parfait et il ya des cas où vous ne voulez pas Alteryx de décider, par exemple un champ de codes zip apparaîtra à Alteryx être des numéros et Alteryx va le mettre à un type de numéro et vous perdrez tous vos zéros au début de votre Massa chusetts les codes postaux. Dans ce cas, vous pouvez utiliser un outil Select. Sélectionnez l'outil L'utilisation de l'outil Select signifie que Alteryx n'évaluera pas les données et les données qui ne correspondent pas à la nouvelle, spécifiée, le type est remplacé par [NULL]. Lorsque vous considérez la taille du champ Assurez-vous que vous êtes familiarisé avec la longueur de la chaîne comme il sera tronqué si elle dépasse la longueur de la chaîne. Pour les types numériques la taille n'est pas configurable, mais si vous êtes à la recherche de précision s'il vous plaît utiliser décimal fixe. Les données trop longues sont arrondies (généralement à 6 décimales). Les décimales fixes sont l'exception: vous utilisez le format de la longueur du nombre de points suivi du nombre de décimales. Que se passe-t-il lorsque j'apporte mes données dans Alteryx? Les types de données sont appliqués à l'intégralité de la colonne/du champ et chaque valeur dans cette colonne. Alteryx mappera automatiquement les types entrants des bases de données et des fichiers structurés (Excel) au meilleur pour le type dans une table Alteryx. Types de données de chaînes Les chaînes sont tout ce que vous voulez garder comme il est. Une chaîne est une combinaison de caractères, alphanumériques et symboles. Vous utiliserez également un type de chaîne si le champ est de valeurs mélangées qui est a des nombres dans une cellule et des mots dans un autre. String et wstring sont des longueurs définies. Les types V_string sont de longueur variable. La quantité de mémoire réservée au traitement varie. Wstring capturera plus de caractères internationaux tels que le japonais ou le chinois. V_String est favorable, car il est assez souple pour ne pas tronquer les champs, mais permettra également de maximiser le temps de traitement en raison de la longueur de la taille de la chaîne de réglage. Types de données numériques Les nombres ou les champs numériques contiennent seulement des nombres. Méfiez-vous des types de champs numériques et des valeurs avec des zéros principaux (tels que 01-le zéro serait supprimé et le nombre apparaîtrait comme un seul). Si vous avez affaire à des codes postaux, gardez cela à l'esprit. Byte est un petit nombre entier. Integer est un nombre entier où les 16, 32 et 64 sont la taille du nombre (plus grand nombre besoin de plus d'espace). Fixed Decimal est généralement utilisé pour la devise, cependant, vous voulez faire attention aux chiffres que vous utiliserez dans les calculs et plus tard roll up. Float et double sont les nombres les plus précis, cependant, ils ne sont pas bons pour la comparaison où vous essayez de voir si une valeur équivaut directement à une autre. Types de données Date %26; Time Le format d'heure de date de Alteryx est spécifique et peut exiger que vous fassiez une certaine manipulation de données pour obtenir vos données dans le format de Alteryx pour employer les fonctions de DateTime dans un outil de formule. Les formats sont: Date-aaaa-mm-jj Date heure: aaaa-mm-jj hh: mm: SS Heure: HH: mm: SS Parfois, les dates peuvent être difficiles à travailler avec, nous avons donc quelques excellents outils que vous pouvez utiliser pour obtenir vos champs de date dans le format Alteryx. Date macro heure L'outil DateTime transforme les données de date/heure vers et à partir d'une variété de formats, y compris les formats lisibles par l'expression et l'homme. @AlexKo analyser les dates macro Pesant à 55 outils Alteryx, cette macro fait son chemin vers le Top 5 des macros les plus téléchargées sur la Galerie Alteryx. Cette macro va emporter un grand nombre de ces date d'analyse des maux de tête et de faire travailler avec des dates amusantes à nouveau! Type de données booléen Booléen est tout simplement vrai ou faux et utile pour le marquage des données. Indicateur conditionnel, où 1 = true et 0 = false Types de données d'objet spatial Les objets spatiaux sont des objets spatiaux tels que les centroïdes et les polygones utilisés pour la cartographie. Alteryx peut apporter des objets spatiaux à partir de types de fichiers de données tels que ESRI shapefiles. Toutefois, si vous disposez d'une latitude et d'une longitude dans Excel, vous pouvez utiliser notre outil créer des points pour créer des objets spatiaux dans Alteryx. Si vous souhaitez plus d'informations sur les types de données s'il vous plaît voir notre aide Alteryx Meilleur, Jordan Barker Consultant solutions Alteryx Designer
Afficher l'article complet
Réglage des fichiers Alteryx pour différentes versions Modifier cette idée à partir d'un autre poste pour garder le sujet frais (j'espère que les affiches précédentes ne sera pas l'esprit!). Alteryx vient de sortir la version 10,6. Rendre Alteryx compatible avec les anciennes versions vient sur la communauté beaucoup lorsque vous répondez à des questions et un utilisateur n'a pas la dernière version du concepteur. Le ci-dessous sert de guide pour s'assurer que vos versions de workflow correspondent à la version du concepteur que vous avez installé. Si vous recevez un message d'erreur ressemblant à celui-ci: Cela signifie que le workflow que vous tentez d'ouvrir a été créé sur une version de Alteryx qui est plus récente que celle que vous utilisez. Alteryx est compatible avec Forward, ce qui signifie que si vous avez développé un workflow dans la version 10,5 par exemple, il s'exécutera dans la version 10,6. Cependant, Alteryx n'est pas compatible en amont. Un workflow développé dans la version 10,6 ne s'exécutera pas dans la version 10,5. Vous avez quelques options à ce stade. Vous pouvez télécharger et installer la version la plus récente de Alteryx (disponible ici). Vous pouvez également modifier la version de votre workflow pour qu'elle soit compatible avec votre version actuelle. Il existe différents types de fichiers Alteryx utilise: yxmd Fichier de workflow standard yxmc Macro Workflow (tous les types) yxwz App analytique (WZ signifie Wizard je crois) yxzp Package de workflow yxdb Base de données Alteryx Les trois premiers sont tous fondamentalement le même format-ils sont la configuration XML du Workflow. Vous pouvez afficher ce dans Alteryx Designer dans la vue XML (Options >> paramètres utilisateur >> modifier les paramètres utilisateur >> Advanced >> afficher XML dans la fenêtre Propriétés). La première section du XML ressemble à: Dans l'Explorateur Windows, accédez à l'emplacement où vous avez enregistré le fichier. Clic droit de la souris et sélectionnez'Edit with Notepad'option. Recherchez ymdVer = "XX. X "et modifiez la version de votre version." Ensuite, enregistrez le fichier. Le nœud AlteryxDocument est le même pour les workflows, les macros et les applications analytiques. L'attribut yxmdVer est la partie du fichier qui indique à Alteryx quelle version provient. Si vous voulez que ce fichier puisse être ouvert par une version plus ancienne, vous pouvez modifier le numéro. Le tableau ci-dessous donne le numéro de version dont vous avez besoin pour différentes versions Alteryx: yxmdVer Alteryx versions 9,5 9,5 10,0 10, 10,1 10,5 10,5 10,6 10,6 Alors quels sont les risques? Alteryx ne garantit pas le format d'outil sérialisé et la configuration sera cohérente de la version à la version-si elle est normalement. L'univers des outils qui existent ne cesse de croître. Si Alteryx ne parviendra pas à trouver l'outil, le concepteur ajoutera un outil inconnu: Cela peut généralement être résolu en trouvant l'outil manquant et en remplaçant l'inconnu par le connu. Si l'outil inconnu se trouve être une macro, utilisez le même processus pour modifier la version du fichier XML yxmc. Une fois que vous l'enregistrez, vous pouvez remplacer votre macro. Qu'en est-il des forfaits? Ce sont en fait juste des fichiers zip avec une extension yxzp. Si vous modifiez l'extension à .zip, vous pouvez jeter un oeil à l'intérieur. C'est juste un cas de mise à jour des fichiers à l'intérieur de la fermeture éclair, puis l'enregistrement de le renommer à yxzp. Comment
Afficher l'article complet
REST API en 5 minutes-pas de codage Se connecter à une API REST de l'intérieur Alteryx est une grande habileté à avoir. Cependant, la documentation de l'API peut être difficile à naviguer, et déterminer où placer les en-têtes requis, les chaînes de requête et les charges utiles peuvent devenir confus. Pour montrer à quel point il peut être simple, nous allons essayer de récupérer des données boursières de quand, une ressource en ligne pour les jeux de données gratuits et Premium, en 5 minutes ou moins. Nous allons utiliser le Guide de démarrage rapide de l'API, réglez votre minuterie ... 1. Configuration de l'environnement Ouvrez un nouveau workflow, ajoutez un outil d'entrée de texte avec une colonne intitulée «URL» et connectez un outil de téléchargement à sa sortie. 2. URL de demande L'exemple dans le Guide de démarrage rapide nous montre ce qu'est une URL devrait ressembler à une demande de données boursières Facebook, nous allons donc ajouter que la valeur de la «URL» de champ dans l'outil d'entrée de texte. https://www.quandl.com/api/v3/datasets/WIKI/FB/data.csv Cela va fonctionner pour l'instant, mais à l'avenir, nous pouvons envisager de fractionner les morceaux distincts de l'URL de la demande dans des champs uniques, et la compilation de la chaîne à l'aide de l'outil de formule, de sorte que le même Workflow peut être utilisé pour télécharger de nombreux datasets différents. Vous pouvez également remarquer le fichier .csv à la fin de la chaîne de demande, ce qui indique que nous voulons que la demande de données soit retournée au format .csv, mais nous pourrions également spécifier JSON ou .XML en fonction de la documentation quand. 3. Authentification Sur la base du Guide de démarrage rapide, les demandes doivent être authentifiées avec une clé API. Allez-y et inscrivez-vous pour une clé. Ajoutez un autre champ à l'outil d'entrée de texte, nommez le champ api_key et ajoutez votre clé comme valeur pour ce champ. La configuration de l'outil d'entrée de texte doit ressembler à ceci: 4. Configuration de l'outil de téléchargement Onglet de base Sélectionnez votre champ URL à partir de la liste déroulante pour l'URL, toutes les autres configurations de base peuvent rester les mêmes. En-têtes Paramètres par défaut Charge La méthode http sera la sélection par défaut,'get (ou FTP)'. La case d'option «composer la chaîne de requête» doit être sélectionnée. Une chaîne de requête est ce qui vient après le point d'interrogation dans le chemin d'URL. Dans la liste des champs disponibles, sélectionnez le champ contenant votre clé API. Connexion Paramètres par défaut 5. Exécution du Workflow Ajoutez un outil de navigation à la fin ou ajoutez un outil de données de sortie si vous souhaitez enregistrer le DataSet. Exécutez le workflow et l'outil de téléchargement ajoutera deux champs à votre workflow, télécharger des en-têtes et télécharger des données. Le champ de données de téléchargement aura les données de stock de Facebook au format de CSV. Réalisant que cela peut ne pas être le plus facile à lire, vous pouvez ajouter un texte à Columns Tool après cela pour analyser les données dans un format plus lisible. Bientôt, je vais prendre une plongée plus profonde dans les configurations de plusieurs outils de téléchargement, ainsi que ce qu'il faut rechercher dans la documentation de l'API. Anticipez la couverture sur d'autres rubriques avancées telles que le traitement de vos données de demande, la pagination de grands ensembles de résultats et d'autres méthodes d'authentification. Quelles questions avez-vous à propos de l'outil de téléchargement? Réglez votre minuterie ... API
Afficher l'article complet
La macro de DataSet de cache Vous pouvez télécharger la version la plus récente de la macro de DataSet de cache (v2) de la Alteryx Analytics Gallery et la lire ici. (vous pouvez également obtenir la version originale du DataSet de cache ici.) Une des grandes choses sur Alteryx est de savoir comment une fois que vous obtenez le coup de lui, vous êtes capable de manipuler des données presque aussi vite que vous pouvez penser à l'étape suivante dans votre processus. Vous finissez par passer moins de temps à jongler avec les mécanismes de mélange et d'analyse de vos données, et plus sur le problème réel de l'entreprise à portée de main. Vous obtenez dans un flux rythmique, cet état d'esprit où vous perdez la trace du monde extérieur tout en éclabousseant les accents de Regex et les faits saillants de la formule sur votre toile, et devenez un avec les données pour créer un chef-d'œuvre de travail. Mais lors de la construction d'un workflow qui traite de grandes quantités de données et/ou exécute des analyses de processeur lourde, vous pourriez trouver difficile d'entrer dans ce flux rythmique que vous êtes habitué quand vous devez attendre plusieurs minutes entre les pistes pour voir les résultats de l'ajout d'un outil ou un Groupe d'outils sur la toile. Une solution à cette limitation de votre flux est d'échantillonner toutes les données. Il y a plusieurs façons de le faire. L'un consiste à placer des outils d'échantillonnage stratégiquement tout au long de votre workflow. Une façon plus robuste et plus propre d'accomplir la même chose est de créer une constante utilisateur pour limiter le nombre d'enregistrements sur les outils d'entrée: Cliquez sur n'importe quel espace sur la toile, puis dans la fenêtre de configuration, accédez à l'onglet "workflow" Ajouter une nouvelle constante définie par l'utilisateur appelée "sample" et la définir à un nombre relativement faible, comme 1000 Dans le panneau de configuration de tous les outils d'entrée, définissez l'option "limiter l'enregistrement" à "% User. Sample%" (sans les guillemets) Développez votre workflow avec le nombre d'enregistrements d'entrée limitée, et lorsque vous êtes prêt à l'exécuter avec l'ensemble complet de données, il suffit de définir l'utilisateur constante définie "sample" pour être vide afin que les données ne sont pas plafonnés Le problème avec cette approche est que dans de nombreux cas, vous n'allez pas voir le comportement dont vous avez besoin pour construire votre workflow de manière appropriée. Mais que faire si vous pouviez "sauver votre place" et d'exécuter uniquement les nouveaux outils que vous avez ajouté à la toile, sans ré-exécuter tout le reste encore une fois? Eh bien, je vais vous montrer comment vous pouvez faire exactement cela-avec l'aide de la macro cache DataSet! Voici une démo rapide de la façon dont il fonctionne. Supposons que vous avez un workflow qui dispose de trois sources de données d'entrée qui ont chacune plus de cent millions de lignes. Vous les Nettoyez et faire un peu de traitement, et déjà cela commence à prendre plus de temps que vous souhaitez attendre avant d'ajouter l'outil suivant et de jouer avec la configuration. À ce stade, vous décidez d'arrêter de déconner et de couper à la poursuite avec la macro de DataSet de cache. Pour ce faire, vous devez d'abord placer les outils que vous avez terminé la configuration dans un conteneur d'outils. Vous ajoutez ensuite une macro de DataSet de cache au dernier outil du flux: Si vous n'êtes pas familier avec l'outil conteneur outil, vous pouvez le trouver dans la catégorie outil de documentation. Pour l'utiliser, il suffit de le placer sur la toile, puis de faire glisser une sélection d'outils en elle. Ensuite, vous devez configurer la macro de DataSet de cache, qui heureusement est très simple. Vous voudrez lui donner un nom unique et descriptif (si vous avez plusieurs macros de DataSet de cache sur votre toile, soyez sûr de leur donner chacun des noms différents!), et vous voudrez laisser le mode d'exécution réglé à «écrivent». Maintenant, lorsque vous exécutez le workflow, le Datastream étant alimenté dans la macro de DataSet de cache (dans ce cas, la sortie du deuxième outil de transposition) sera enregistrée en tant que fichier temporaire. (plus spécifiquement, il sera enregistré en tant que fichier de données Alteryx dans le même dossier que la macro de DataSet de cache lui-même.) Installation terminée! Nous allons accélérer notre workflow! Maintenant que nous avons la configuration du workflow pour utiliser la macro de DataSet de cache, nous allons le mettre à l'utilisation. Après avoir exécuté le workflow une fois avec la macro de DataSet de cache en mode "Write", vous pouvez l'activer en mode "Read" afin qu'il référence le fichier temporaire au lieu du flux d'entrée. Lorsque vous faites cela, vous verrez un indicateur d'erreur sur la macro de DataSet de cache vous indiquant qu'il est en "mode lecture". Ce n'est pas une erreur réelle, mais est destiné à être un indicateur visuel commode de sorte que lorsque vous commencez à construire un grand flux de travail avec de nombreuses macros de DataSet de cache, vous pouvez dire instantanément ceux qui sont mis à "Read" mode. Cela est important car cela signifie que l'entrée Datastream est ignorée, et si vous effectuez des modifications à un outil en amont, ces modifications ne passeront pas par la macro de DataSet de cache alors qu'elle est en mode «Read» puisqu'elle est lue à partir du DataSet temporaire enregistré au. Maintenant, lorsque vous exécutez le workflow à nouveau, au lieu de prendre quelques minutes, il finira de fonctionner presque instantanément! Vous pouvez maintenant continuer à créer votre workflow à partir de la macro de DataSet de cache. Lorsque vous avez votre configuration de workflow à votre goût, vous pouvez faire un clic droit sur les macros de jeu de données de cache et "supprimer et se connecter" pour se débarrasser d'eux sans perturber le flux des données, ou vous pouvez simplement placer la macro en "Bypass" mode, qui permettra le flux de données THRO ugh il intact comme si elle n'était même pas là. Retour dans le flux Une fois que vous commencez à utiliser la macro de jeu de données de cache, vous obtiendrez le coup de lui rapidement, et vous retrouverez de nouveau dans cette cannelure douce que vous êtes habituée, même lors de l'élaboration de certains lourds traitement intensive des ressources dans votre workflow. Espérons que vous trouverez la macro de jeu de données de cache pour être un ajout utile à votre boîte à outils qui vous permet d'obtenir plus de Alteryx. Si vous avez des questions, des commentaires, ou des commentaires, s'il vous plaît le partager dans la section commentaires ci-dessous, je l'apprécierais vraiment et je suis heureux de vous aider avec tous les problèmes que vous pourriez rencontrer. Une note rapide avant de se séparer: comme indiqué, cette macro écrit des datasets temporaires dans le dossier contenant la macro de DataSet de cache. Il se peut que vous souhaitiez supprimer occasionnellement les datasets dans ce dossier s'ils prennent beaucoup d'espace. À un certain point, j'ai l'intention de mettre à jour la macro pour inclure la logique pour le nettoyage de ces jeux de données temporaires, mais ce sera pour une autre fois. Quand je fais, je vais être sûr de lien vers la mise à jour ici. En attendant, c'est laissé à l'utilisateur. Après Pour conclure, je voulais montrer un exemple de ce qu'un workflow pourrait ressembler qui a été développé une section à la fois avec la macro de DataSet de cache. Dans la capture d'écran de workflow ci-dessous, j'ai eu trois grands ensembles de données que j'avais besoin de transformer et de normaliser avant de développer un modèle avec l'ensemble d'outils prédictifs Alteryx. C'était en fait ce problème très qui a été l'inspiration pour la macro de DataSet de cache. Sur le côté gauche se trouve le workflow final avec tous les conteneurs d'outils activés et les datasets de cache en mode "Write" (encerclé en rouge pour les rendre plus visibles), et sur la droite est le même Workflow avec les conteneurs désactivés et les macros de mise en cache mis en mode "Read". Shoutout à collègues ingénieur de contenu Neil Ryan, qui a également développé une macro de mise en cache avec la même fonctionnalité indépendamment, avant que je fasse. Je ne me sens pas juste en prenant le plein crédit pour cette solution à un problème commun que nous avons tous rencontré, quand Neil m'a battu au Punch. En dépit de la création fondamentalement la même chose, pour quelque raison que sa macro n'a pas eu autant de visibilité au sein de notre groupe, et en conséquence, je suis celui qui écrit ce billet de blog. C'est une véritable situation de Leibniz-Newton. Donc, si cela est bien reçu, je suis heureux de partager la gloire avec Neil. Mais si vous ne l'aimez pas, s'il vous plaît diriger votre colère et la déception envers Neil, puisque quand vous y pensez, c'était son idée d'abord. À: -10/12/2015: Une mise à jour mineure de la macro a été téléchargée afin qu'elle puisse être présente dans les workflows téléchargés dans la galerie en 10,0. Lorsqu'une macro est dotée d'un outil d'entrée et d'un outil de sortie qui pointe vers le même fichier, elle l'interprète comme un problème et indique que la validation a échoué. Cela se produit dans cette macro, puisque nous sommes à la fois la lecture et l'écriture à partir du fichier mis en cache temporaire, même si elle ne se produit jamais en même temps. Nous obtenons autour de ceci en pointant les outils d'entrée/sortie à différents noms de fichier d'espace réservé, et puisque les outils d'action mettent à jour le chemin en utilisant le nom spécifié par l'utilisateur dans la configuration, nous sommes bons pour aller. Gardez à l'esprit cependant, que si vous êtes en téléchargeant un workflow à la galerie qui utilise cette macro, vous serez OK si elle est réglée sur "Write" ou "Bypass" mode, mais se déroulera dans les problèmes si vous l'avez réglé sur "Read" mode! -10/14/2015: Ajout d'un lien pour télécharger la macro à partir de la galerie en haut de la page. -04/11/2016: Ajout d'un lien vers la macro cache DataSet V2 en haut de la page. Le développement de workflows à forte intensité de ressources peut être un défi lorsque les modifications de test impliquent l'exécution du workflow via des itérations qui peuvent prendre plusieurs minutes ou plus avant d'être en mesure de voir les résultats. Ce message parcourt l'utilisation de la macro de DataSet de cache pour développer des workflows d'une manière plus intelligente, éviter les temps de longue durée répétés et accélérer le processus de fusion et d'analyse de plus grandes séries de données. Cache
Afficher l'article complet
Étiquettes