Base de Connaissance - Français

Apprenez auprès des experts.
Nous sommes ravis de vous présenter de nouvelles ressources interactives ! Découvrez vite tout ce qui est disponible dans la version bêta de l’Academy française Alteryx !
Maîtrise de l'outil | Formule à plusieurs lignes Cet article fait partie de la série d'outils de maîtrise, une compilation des contributions de base de connaissances pour introduire des exemples de travail diversifiés pour les instruments de concepteur. Ici, nous allons plonger dans les utilisations de l'outil de formule à plusieurs lignes sur notre façon de maîtriser le concepteur Alteryx: L'outil de formule à plusieurs lignes fonctionne comme l'outil de formule normal, mais ajoute la possibilité de référencer plusieurs lignes de données dans une expression. Disons, par exemple, quelqu'un était au rez-de-chaussée d'une maison et avait un outil de formule. Ils ne seraient en mesure de parler aux gens aussi au rez-de-chaussée. Si ils avaient un outil de formule à plusieurs lignes, cependant, ils seraient également en mesure de parler aux gens à l'étage, dans le grenier, et dans le sous-sol ainsi. L'outil de formule à plusieurs lignes permet à l'utilisateur de mettre à jour un champ existant ou de créer un autre. Les deux options peuvent être très utiles, et il ya de nombreux cas d'utilisation pour chacun. Les cas d'utilisation que nous détaillons ci-dessous sont joints dans le yxmd de workflow v 11.0. Mettre à jour le champ existant "remplissage vers le bas" un champ: Souvent, les données peuvent être arrangées d'une manière qui semblerait bonne dans Excel mais n'est pas réaliste pour travailler avec dans Alteryx. Dans ces instances, vous pouvez souhaiter «remplir» une colonne qui a des valeurs manquantes. Dans ce cas, seule la première personne dans chaque famille a son nom de famille peuplé. Par conséquent, nous aimerions modifier le champ famille où il est actuellement null (). Cela peut facilement être accompli comme ceci: Pour obtenir facilement des variables et des fonctions dans la zone d'expression, il suffit de double-cliquer dessus à partir de leur onglet correspondant dans la configuration. Créer un nouveau champ: Créer un ID unique pour chaque personne du groupe: Maintenant que les données sont nettoyées, nous voulons ajouter un ID unique à chaque personne en fonction de la famille à laquelle elles appartiennent. Afin d'y parvenir, nous allons configurer l'outil de formule multiligne comme suit: Lors de la création d'un nouveau champ, l'utilisateur a la possibilité de sélectionner le type de champ à lui donner. Ici, int 16 a été choisi. Notez que nous regroupons par famille parce que nous voulons que l'ID soit unique au sein de chaque famille, mais il peut recommencer avec différentes familles. Ce nouveau champ ID peut être utilisé ultérieurement en tant qu'identificateur avec des outils tels que Filter, Resume et plus encore. Effectuer des calculs: Qu'est-ce qu'un bon outil multiligne sans la possibilité de référencer plus que juste les lignes directement avant ou directement après? En modifiant la valeur des lignes num dans la configuration, vous pouvez augmenter le nombre de lignes que vous pourrez utiliser dans vos expressions. Dans cet exemple, nous avons augmenté les lignes num sur 2. Remarquez comment il ya maintenant plus de variables à sélectionner dans la section du milieu sur la configuration. Parce que nous voulons le total de fonctionnement par famille, nous regroupons à nouveau par ce champ. Cette méthode peut être étendue pour générer des totaux en cours d'exécution dans de nombreux scénarios différents, y compris les ventes monétaires, les comptes d'articles et plus encore. Maintenant, nous voulons calculer la quantité moyenne de temps d'écran total par famille. Dans cette boîte d'expression de l'outil de formule multiligne, nous écrivons: iif([ID]=3,average([Row-2:Total Screen Time],[Row-1:Total Screen Time],[Total Screen Time]),iif([ID]=2,average([Row-1:Total Screen Time],[Total Screen Time],[Row+1:Total Screen Time]),average([Row+2:Total Screen Time],[Row+1:Total Screen Time],[Total Screen Time]))) Cette méthode vérifie la valeur d'ID de chaque ligne et personnalise la formule pour générer une moyenne en utilisant les lignes correctes. Différence par rapport au précédent: La dernière partie de la configuration de cet outil qui n'a pas encore été modifiée est les valeurs des lignes qui n'existent pas déroulantes. Cela indique à Alteryx ce qu'il faut utiliser lorsqu'une formule doit utiliser la valeur d'une ligne qui n'existe pas (d'où le nom de la liste déroulante). Cela se produirait, par exemple, lors du calcul d'une valeur pour la première ligne de données lorsque l'expression contient une variable Row-1. L'utilisateur peut choisir ce que la valeur de ligne inexistante est. Dans cet exemple, la ligne qui n'existe pas est définie sur la ligne valide la plus proche. De cette façon, lorsque la formule tente d'utiliser [Row-1: temps total de l'écran] sur la ligne 1 et voit qu'elle n'existe pas, elle utilise à la place la valeur de la ligne 1. Cela se traduit par la différence de 0 que vous voyez dans la sortie. Un tri a été placé avant cet outil de formule à plusieurs lignes pour trier le temps total de l'écran dans l'ordre décroissant. La formule ci-dessus a créé un champ qui est la différence entre la durée totale de l'écran de la ligne actuelle et la durée totale de l'écran de la ligne précédente. Cela rend facile de voir combien plus de temps d'écran chaque personne a besoin afin de rattraper la personne devant eux. Plusieurs fois, l'outil de formule à plusieurs lignes sera utilisé en combinaison avec l'outil Cross Tab. Ceci est particulièrement utile si vous essayez de transformer quelques colonnes de données en une table. Un membre de la communauté Alteryx avait ce problème exact et a été en mesure de le faire résoudre dans ce post. L'outil de formule à plusieurs lignes ne peut mettre à jour qu'un seul champ par instance d'outil. Si vous souhaitez mettre à jour plusieurs champs (et que vous vous sentez à l'aise avec l'outil de formule multiligne et l'outil de formule multichamp), essayez cette macro qui a été affichée dans la Galerie Alteryx publique. Maintenant, vous devriez avoir une compétence de niveau expert avec l'outil de formule à plusieurs lignes! Si vous pouvez penser à un cas d'utilisation, nous avons laissé de côté, n'hésitez pas à utiliser la section commentaires ci-dessous! Considérez-vous comme un maître d'outils déjà? Faites-nous savoir à Community@alteryx.com si vous souhaitez que votre outil créatif utilise pour être présenté dans la série de maîtrise d'outils. Restez à l'écoute avec nos derniers messages chaque #ToolTuesday en suivant @alteryx sur Twitter! Si vous souhaitez maîtriser tous les outils de concepteur, envisagez de vous abonner aux notifications par courrier électronique. L'outil de formule à plusieurs lignes fonctionne comme l'outil de formule normal, mais ajoute la possibilité de référencer plusieurs lignes de données dans une expression. Disons, par exemple, quelqu'un était au rez-de-chaussée d'une maison et avait un outil de formule. Ils ne seraient en mesure de parler aux gens aussi au rez-de-chaussée. Si ils avaient un outil de formule à plusieurs lignes, cependant, ils seraient également en mesure de parler aux gens à l'étage, dans le grenier, et dans le sous-sol ainsi. 11,0
Afficher l'article complet
Supprimer l'espace vide de tête / de fin / tout Question Comment puis-je supprimer des espaces vides de mes données?? Au secour! Réponse Il y'a un quelques situations différentes concernant les espaces vides que vous êtes probable de rencontrer, mais le schéma ci-dessous (à partir de l'annexe v 10.6 exemple) répondra à toutes vos questions. La plupart des approches utilisent la fonction (Trim) de l'outil de Formule qui, sans un deuxième argument, taille par defaut les espaces de vos chaînes. Post Designer version 10.5 vous pouvez également utiliser l'outil de Nettoyage de données pour vous "nettoyer" vos champs! Devenez un Maître ici. 10,5
Afficher l'article complet
Création de valeurs NULL dans les données Dans le traitement et le formatage de vos données, vous pouvez décider que certains enregistrements doivent être classés en tant que valeurs NULL. Plutôt que de remplir des champs numériques avec un 0 ou de laisser un champ vide (''), une valeur NULL peut être la meilleure option pour analyser et stocker vos données. Dans cet exemple particulier, imaginons que nous avons des ID de client et les numéros de téléphone qui leur sont associés. Certains numéros de téléphone peuvent être incomplets ou détypés. Après suppression de la ponctuation avec l'outil de nettoyage des données, nous allons chercher des numéros de téléphone valides-ceux composés de 10 chiffres-pour stocker dans notre base de données client. Pour identifier nos résultats valides, nous allons appliquer une déclaration conditionnelle: si un numéro de téléphone n'est pas de 10 chiffres de long, alors l'enregistrement est null; sinon (sinon) utilisez le numéro de téléphone dans nos données. L'expression utilisée pour assigner une valeur null se trouve dans les fonctions spécialisées de l'outil de formule: À la suite de l'expression ci-dessus, les deux numéros de téléphone qui sont soit un chiffre trop court (9 chiffres de longueur) ou un chiffre trop long (11 chiffres de longueur) ont été exprimés comme NULL: Expression
Afficher l'article complet
Utilisation d'instructions conditionnelles pour modifier vos données Si vous utilisez l'outil de formule dans la version 11.0 +, assurez-vous de vous familiariser avec la refonte de l'interface de l'outil! Un composant important du mélange de données applique des processus mathématiques ou transformations à des sous-ensembles de vos données. Souvent, cela nécessite d'isoler les données qui sont conformes à un certain nombre de critères que vous avez définis: "je veux seulement marquer les SKU pour les produits dont le coût est inférieur à $10" «les clients âgés de 25 à 40 devraient être classés dans le groupe A, 41-65 en tant que groupe B et 66 + en tant que groupe C» "classer les transactions en semaine ou en week-end". "si un produit est rouge, renommez R." Si c'est bleu, renommez le B. Si c'est jaune, renommez ça en Y. Si c'est vert, renommez ça en G. Sinon, renommez l'autre ". L'une de ces situations vous semble familière? Si oui, alors un bon endroit pour commencer à transformer vos données est les fonctions conditionnelles de l'outil de formule (figure 1). Les fonctions conditionnelles construisent des expressions qui vous permettent d'appliquer des processus aux données qui satisfont les conditions que vous définissez. Peu importe si vous venez du monde de SQL, Excel, R ou un autre programme de données qui a été de rendre votre vie plus difficile que ce qu'il devrait être, le concept de l'énoncé conditionnel reste le même: si une condition est ou n'est pas vrai, puis appliquer un processus ou un résultat. Sinon, appliquez un processus ou un résultat différent. Cette logique peut prendre le format de l'un des quatre types d'expressions différents: (1) une déclaration traditionnelle If peut être un outil puissant dans la transformation des données. Structurellement, Alteryx requiert quatre clauses distinctes pour appliquer cette logique de type à vos données: Si une condition est (pas) vraie alors appliquez la fonction a else appliquent la fonction B endif En utilisant la première situation (SKU et prix) à titre d'exemple, la déclaration If nous permet de déterminer quels produits seront marqués pour une analyse plus poussée: (2) une instruction imbriquée if permet de définir plusieurs conditions, en regroupant essentiellement des instructions logiques, en utilisant des instructions logiques répétées semblables à une instruction if unique. Bien que la documentation fournit un exemple avec trois conditions définies, ce n'est en aucun cas une limite dans le nombre de critères qui peuvent être définis. Tant que la syntaxe correcte est utilisée, de nombreuses autres conditions peuvent être définies! Considérez la deuxième situation (groupes d'âge des clients). En continuant avec la syntaxe correcte, quatre groupes (A, B, C et autres) sont créés à la suite de l'instruction imbriquée. Lorsque vous travaillez avec des instructions imbriquées, vous pouvez trouver utile de diviser chaque clause en une nouvelle ligne dans la zone expression, comme indiqué dans l'exemple ci-dessous. (3) bien que les instructions If en ligne (IIF) appliquent une logique similaire à une instruction if, l'évaluation d'une condition soit «true» ou «false», elles diffèrent syntaxiquement. Les expressions IIF nécessitent trois composants séparés par une virgule: une expression booléenne à évaluer, le résultat «vrai» et le résultat «false». Les résultats vrais et faux prennent en charge non seulement le texte mais aussi les opérations mathématiques. Dans le cas de la troisième situation, où un enregistrement ne peut être classé que comme l'un des deux types (en semaine ou en fin de semaine), une déclaration IIF classe efficacement les données selon un critère logique de savoir si la valeur de [Day] n'est pas «SAT» ou «Sun». Le résultat réel de cette instruction renvoie «jour ouvrable»; le faux résultat est «weekend». (4) la fonction de commutation de l'outil de formule est une gemme cachée! Pièce Find/Replace Tool, partie imbriquée if, instruction part case dans SQL ... c'est pratique! Cette expression évalue plusieurs conditions pour assigner un résultat désigné. Si aucune condition n'est remplie, une valeur par défaut (value) est définie. La fonction Switch offre un couple d'avantages sur des fonctionnalités similaires dans Alteryx. Tout d'abord, il accorde une grande partie de la souplesse d'une déclaration imbriquée if sans avoir à répéter IFS, thenes, ELSEIFs .... etc. Deuxièmement, il peut servir une fonction similaire comme outil de recherche/remplacement sans avoir à créer une deuxième instance de toutes les données que vous souhaitez trouver et les données correspondantes utilisées comme remplacement. Me sauver un peu de temps et de frappe sujette aux erreurs? Fais-moi signe! Remarque: les types d'opérateurs qui peuvent être utilisés dans une expression dépendent du type de données du champ de sortie. Si vous écrivez dans le champ chaîne (ou autre type de texte), le résultat nécessitera des guillemets (simple ou double) autour. Notez comment le groupe'a'est encapsulé par des guillemets simples. Les champs numériques, d'autre part, ne nécessitent pas de guillemets autour du résultat. * le workflow ci-joint est compatible avec Alteryx designer version 10.0 et supérieure. Un composant important du mélange de données applique des processus mathématiques ou transformations à des sous-ensembles de vos données. Souvent, cela nécessite d'isoler les données qui respectent un certain critère que vous avez défini. Les fonctions conditionnelles construisent des expressions qui vous permettent d'appliquer des processus aux données qui satisfont les conditions que vous définissez. 10,0
Afficher l'article complet
Supprimer les zéros principaux Question Comment puis-je supprimer les zéros de premier plan d'un champ? Réponse Utilisez l'outil formule (si vous utilisez l'outil formule dans v 11.0 +, assurez-vous de vous familiariser avec la refonte de l'interface de l'outil!) et la fonction TrimLeft () pour supprimer les zéros principaux. TrimLeft (String, "y")-supprime y du début de la chaîne. Par défaut pour couper les espaces. Exemple d'entrée: Sortie d'échantillon: Configuration de formule: TrimLeft ([champ1], "0") supprime tous les 0 caractères du début de la chaîne. Si vous ne voulez pas remplacer 0 par "", filtrer tous les enregistrements qui = ='0', utilisez TRIMLEFT () sur toutes les autres chaînes, puis Union les résultats. Remarque: l'utilisation de Trim () supprime la chaîne du début et de la fin de la chaîne. Vous pouvez également utiliser l'outil Regex pour rechercher et remplacer les zéros principaux. Configuration Regex: 0 Voir l'exemple de workflow v 10.6 attaché. Comment puis-je supprimer les zéros de premier plan d'un champ? Utilisez l'outil formule et la fonction TrimLeft () pour supprimer les zéros principaux! Comment
Afficher l'article complet
Grattage Web Grattage Web, le processus d'extraction de l'information (généralement en tableaux) à partir de sites Web, est une approche extrêmement utile pour recueillir encore des données hébergées sur le Web qui n'est pas fourni via les API. Dans de nombreux cas, si les données que vous recherchez sont autonomes ou capturées complètement sur une page (pas besoin de requêtes API dynamiques), il est encore plus rapide que le développement de connexions API directes à collecter. Avec la richesse des données déjà fournies sur des sites Web, l'accès facile à ces données peut être un grand supplément à vos analyses pour fournir le contexte ou juste fournir les données sous-jacentes pour poser de nouvelles questions. Bien qu'il existe une poignée d'approches de grattage Web (deux détaillées sur notre communauté, ici et ici), il ya un certain nombre de grands, libres, outils (parsehub et import.IO pour n'en nommer que quelques-uns) en ligne qui peut rationaliser vos efforts de grattage Web. Cet article détaille une approche que je trouve être particulièrement facile, en utilisant Import.IO pour créer un extracteur spécifique à vos sites Web désirés, et l'intégration des appels à eux dans votre flux de travail via un lien API de requête en direct qu'ils fournissent par le biais du service. Vous pouvez le faire en quelques étapes rapides: 1. Accédez à leur page d'accueil, https://www.Import.IO/, et «inscrivez-vous» dans le coin supérieur droit: 2. Une fois que vous êtes inscrit à l'utilisation du service, accédez à votre tableau de bord (un lien peut être trouvé dans le même coin de la page d'accueil une fois connecté) pour gérer vos extracteurs. 3. Cliquez sur "nouvel extracteur" dans le coin supérieur gauche et collez l'URL qui contient les données que vous essayez de gratter dans le "créer Extractor" pop up. Depuis la saison de dessin fantasy football est juste devant nous, nous allons aller de l'avant et l'utilisation comme un exemple de données compilées par les meilleurs buteurs de l'année dernière fourni par ESPN afin que vous ne finissent pas comme ce gars-là (Merci plus tard). Nous savons que nos utilisateurs vont dur et les enjeux sont probablement assez élevés, nous voulons donc vouloir obtenir ce droit la première fois, et en utilisant une approche qui est assez reproductible pour nous fournir les informations nécessaires pour nous garder parmi les équipes de haut chaque année. 4. Après quelques instants, import.IO aura gratté toutes les données de la page Web et vous l'affichera dans leur «vue de données». Ici, vous pouvez ajouter, supprimer ou renommer des colonnes dans la table en sélectionnant des éléments sur la page Web – il s'agit d'une étape facultative qui peut vous aider à affiner votre dataset avant de générer votre URL de requête Live API pour le transfert, vous pouvez tout aussi facilement effectuer la plupart de ces opérations dans t Il designer. Pour mon exemple, j'ai renommé les colonnes pour refléter les noms de statistiques sur ESPN et a ajouté le "misc TD" champ qui a échappé à l'algorithme de grattage. 5. Une fois que vos données sont prêtes à l'importation, cliquez sur le bouton rouge "Done" dans le coin supérieur droit. Vous serez redirigé vers votre tableau de bord où vous pouvez maintenant voir l'extracteur que vous avez créé dans la dernière étape-Sélectionnez cet extracteur et recherchez la pièce de puzzle "intégrer" l'onglet juste au-dessous du nom de l'extracteur dans votre vue. Vous pouvez copier et coller l'"API de requête en direct" (il ya aussi une option pour télécharger un fichier CSV de vos données) énumérés ici dans une fenêtre de navigateur pour copier la réponse JSON qui contient vos données, ou vous pouvez mettre en œuvre un appel à elle directement dans votre workflow en utilisant l'outil de téléchargement (n'oubliez pas de sélectionner "coder l'URL" comme vous spécifiez le champ URL): Voilà! Vous devez maintenant avoir une API de requête en direct intégrée pour votre page Web, et avec un extracteur qui peut être exploité pour ratisser des données à partir de ce site si vous voulez essayer d'autres pages ainsi. Si vous souhaitez en savoir plus sur l'approche, ou sur la façon de le personnaliser avec des scripts externes, essayez la communauté Import.IO. L'échantillon que j'ai utilisé ci-dessus est attaché ici dans la version 10.5 de workflow yxmd, il vous suffit de mettre à jour l'API de requête en direct avec un spécifique à votre compte, extracteur et URL de page Web. Si vous décidez de lui donner un essai avec l'exemple ci-dessus, soyez sûr de nous faire savoir si nous avons aidé votre équipe fantastique gagner gros! 10,5
Afficher l'article complet
Comment l'outil Jointure fonctionne et pourquoi vous pourriez obtenir plus d'enregistrements que prévu Tandis que l'outil Jointure est facilement l'un des outils les plus utilisés dans Alteryx, il peut également être l'un des plus mal compris. Cela est encore plus probable si un nouvel utilisateur n'a jamais utilisé des fonctions "joindre" dans autre plate-formes de manipulation de données ou il se joint à de grandes tables où il ne surveille pas la trace des enregistrements à l'intérieur des champs auxquels il se joint. Ainsi, je vais couvrir trois cas différents que vous serez probable à rencontrer qui vous montrera comment joindre deux tables en utilisant un champ commun. Le workflow que je vais couvrir (ci-joint dans cet article) est un workflow que j'ai fait en 10,5 et contient les mêmes visuels qui sont ci-dessous. Cas #1: Joindre par champs qui ont tous les deux des enregistrements uniques C'est le cas le plus simple et le plus facile à comprendre. Dans ce cas, nous faisons une "Jointure" par les champs nommés «fruit» dans les deux entrées. La jointure alignera les enregistrements des deux tables si les enregistrements dans les champs "fruit" correspondent. Ainsi, la table jointe attendue (sortie J) devrait ressembler à ceci: Assez simple Cas #2: Joindre par champs où un seul a des enregistrements uniques Pour ce cas, nous avons deux enregistrements pour "Banana" dans notre entrée gauche. Cela signifie que l'enregistrement avec "Banana" dans l'entrée de droite correspondra deux fois et sera ajouté aux deux enregistrements de l'entrée gauche. Notre Sortie devrait ressembler à ceci: Cas #3: Joindre par champs qui ont tous les deux des enregistrements non uniques Celui-ci peut être le plus difficile à comprendre, mais j'espère que, après avoir regardé cela visuellement et mathématiquement vous comprendrez pourquoi cela fait sens et ce que vous pouvez faire pour éviter les enregistrements indésirables. Dans ce cas, nous avons deux enregistrements de «fruits» qui ont tous les deux «banane» dans les deux tableaux. La même chose se passe ici, tout comme le cas ci-dessus, sauf maintenant, il arrive deux fois parce que nous avons deux enregistrements de l'entrée droite qui correspondent à deux enregistrements de l'entrée de gauche. Ainsi, notre production aura un total de 4 enregistrements qui contiendront le mot «banane». La sortie devrait ressembler à ceci: Pour examiner cela mathématiquement pour le cas #3 et le cas #2, vous saurez combien d'enregistrements vous obtiendrez pour chaque instance d'enregistrement en multipliant la quantité d'enregistrements qui apparaissent dans les deux tables. Dans l'exemple ci-dessus puisque nous faisons une "Jointure" sur "fruit" et nous voyons l'enregistrement "banana" deux fois dans les deux tables, vous pouvez le considérer comme 2 bananes x 2 bananes = 4 bananes. Si nous ajoutons une autre rangée sur notre entrée droite comme ça: Nous aurons maintenant 3 x 2 donc nous devrions nous attendre 6 combinaisons d'enregistrements avec "Banana" dans le champ "fruit" Si vous avez joint deux tables et vous recevez beaucoup plus d'enregistrements, alors que vous vous attendiez pas, ceci est probablement la cause de votre problème. Si on ne comprend pas les cas présentés ci-dessus ,cela pourrait certainement rendre quel qu'un fou. Pour les meilleures pratiques, si j'étais vous, je suivrais ces deux étapes avant de joindre toutes autres tables: première: Vérifiez vos tables pour des enregistrements en double. Pour le cas ci-dessus, comme nous avons trois doublons qui viennent de notre entrée droite, nous pouvons simplement utiliser l'outil Unique et se débarrasser de ces doublons. La sortie sera exactement la même sortie que la sortie de cas #2 comme il n'y aura qu'un seul enregistrement de "Banana" après l'outil Unique. 2ème: Regardez si la "Joindre sur plusieurs champs" est l'option la plus appropriée. Exemple: nous avons la table 1 avec deux enregistrements contenant « Banana » pour « fruit » et deux enregistrements contenant « X » pour « Store ID » avec « FruitID » correspondant à « fruit ». Le tableau 2 a les mêmes champs « fruit » et « Store ID », sauf que maintenant nous avons un champ « Store employees » qui s'associe au « Store ID ». Tableau 1 tableau 2 Nous voulons que toutes ces données soient réunies pour qu'ils se correspondent correctement. Idéalement, nous ne devrions avoir que quatre enregistrements sortent de notre "jointure" comme nous voulons obtenir les "Store Employees" et "FruitID" champs dans une table. Par contre, si nous devions joindre à un seul champ commun, que ce soit "Store ID" ou "Fruit", nous obtiendrions des combinaisons et les données ne seraient pas alignées correctement. Voir ci-dessous. Joindre sur "Fruit" Dans ce cas, nous obtenons deux enregistrements où nos "Store ID" ne correspondent pas. Joindre sur "StoreID" Dans ce cas, nous obtenons deux enregistrements où nos "Fruits" ne correspondent pas. Pour corriger cela, nous allons configurer notre "Jointure" pour correspondre sur les champs "Fruits" et "Store ID" Après avoir Exécuté, la table jointe devrait ressembler à ceci: Lors de "jointure" avec plusieurs champs, nous nous assurons que les enregistrements de ces deux champs correspondent avant de "Joindre". Un moyen facile de penser à cela est d'imaginer que "Fruits" et "Store ID" se font fusionner ensemble. Maintenant, nous avons des enregistrements uniques parce que nous aurions Banana X et Banana Y comme deux entités uniques et notre jointure va maintenant devenir un enregistrement 1 X enregistrement joint 1. 10,5
Afficher l'article complet
Exécution des prévisions chronologiques dans Alteryx designer La prévision des séries chronologiques utilise un modèle pour prédire les valeurs futures en fonction des valeurs précédemment observées. Dans une prévision de séries chronologiques, la prédiction est basée sur l'histoire et nous supposons que l'avenir ressemblera au passé. Nous projetons les tendances actuelles à l'aide des données existantes. Ce qui suit est une description de haut niveau des deux méthodologies préemballées de séries chronologiques nos outils prédictifs de soutien: Modèle ARIMA pour les prévisions TS ARIMA est la moyenne mobile intégrée de la régression et est l'approche de prévision la plus couramment utilisée Modèle ETS aux prévisions TS Le modèle ETS utilise une méthode de lissage exponentielle et est une approche de prévision couramment utilisée, basée sur une moyenne pondérée des observations passées, les poids diminuant en taille pour des valeurs passées plus lointaines. En bref, toutes les valeurs passées sont prises en compte dans la prévision, mais avec une importance décroissante, car les valeurs sont plus reculées dans le temps. <a href="<a href="https://cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fwww.youtube.com%2Fembed%2FabBzvDijEnM%3Ffeature%3Doembed%26;url=http%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3DabBzvDijEnM%26;image=https%3A%2F%2Fi.ytimg.com%2Fvi%2FabBzvDijEnM%2Fhqdefault.jpg%26;key=fad07bfa4bd747d3bdea27e17b533c0e%26;type=text%2Fhtml%26;schema=youtube</A" target="_blank">https://cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fwww.youtube.com%2Fembed%2FabBzvDijEnM%3Ffeature%3Doembed%26;url=http%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3DabBzvDijEnM%26;image=https%3A%2F%2Fi.ytimg.com%2Fvi%2FabBzvDijEnM%2Fhqdefault.jpg%26;key=fad07bfa4bd747d3bdea27e17b533c0e%26;type=text%2Fhtml%26;schema=youtube</A</a>" target="_blank"><a href="https://cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fwww.youtube.com%2Fembed%2FabBzvDijEnM%3Ffeature%3Doembed%26;url=http%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3DabBzvDijEnM%26;image=https%3A%2F%2Fi.ytimg.com%2Fvi%2FabBzvDijEnM%2Fhqdefault.jpg%26;key=fad07bfa4bd747d3bdea27e17b533c0e%26;type=text%2Fhtml%26;schema=youtube</A</a>&gt" target="_blank">https://cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fwww.youtube.com%2Fembed%2FabBzvDijEnM%3Ffeature%3Doembed%26;url=http%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3DabBzvDijEnM%26;image=https%3A%2F%2Fi.ytimg.com%2Fvi%2FabBzvDijEnM%2Fhqdefault.jpg%26;key=fad07bfa4bd747d3bdea27e17b533c0e%26;type=text%2Fhtml%26;schema=youtube</A</a>&gt</a>;" width="600" height="337" scrolling="no" frameborder="0" allowfullscreen=""> En outre, la vidéo vous guide à travers la façon de confirmer l'intégralité de vos données en utilisant l'outil de résumé de terrain et vous montre comment utiliser TS comparer les deux analyser les niveaux d'erreur des méthodes de prévision. Séries chronologiques est composé d'une variété d'outils dans Alteryx, qui font partie de la licence Alteryx designer standard. Les clients de Alteryx utilisent les analyses prédictives pour identifier les modèles trouvés dans les données historiques et transactionnelles pour identifier les risques ainsi que les opportunités. Alteryx outils d'analyse prédictive sont construits sur Open source r. Alteryx les utilisateurs ne sont pas tenus de connaître r pour exécuter des modèles prédictifs parce que tous les modèles de Alteryx sont empaquetés dans des outils macro faciles à utiliser qui nécessitent uniquement la configuration. Tous les outils prédictifs sont des macros, et donc pas une «boîte noire». Les macros fournissent à l'utilisateur la possibilité d'ouvrir tous les modèles et de disséquer la logique, ainsi que de voir et de modifier le ou les scripts R en cours d'exécution. Cette vidéo fournit un bref didacticiel sur l'utilisation des outils de la série Times sur les ventes historiques de maisons unifamiliales et comprend une vue d'ensemble sur la façon de configurer les outils suivants: Résumé du champ, ARIMA, ETS, TS compare et TS Forecast Alteryx Designer
Afficher l'article complet
Maîtrise de l'outil | Tableau croisé dynamique Cet article fait partie de la série Maîtrise d'Outil, une compilation des contributions de base de connaissances pour introduire des exemples de workflow diversifiés en utilisant les outils de Designer. Ici, nous allons plonger dans les utilisations de l'outil Tableau croisé dynamique et au même temps, nous apprendrons à maîtriser Alteryx Designer:   Parfois, vous regardez le gros stack de données devant vous et vous vous demandez comment vous pourrez l'obtenir sous la forme dont vous voulez. Chaque option semble de nécessiter beaucoup de travail manuel, et en tant que professionnel de données que vous êtes, c'est tout simplement quelque chose que vous n'allez pas supporter.   Dans des situations comme celles-ci, vous envisagez peut-être de secouer les choses. Il n'y a pas de meilleur outil pour cela que le Tableau croisé dynamique, un outil puissant qui vous permet de remodeler vos données n'importe quel-façon, en vous permettant d'aborder votre problème à partir d'un nouvel angle. Dans cet article, je vais présenter quelques cas d'utilisation pour montrer comment vous pouvez vous en servir comme levier.   Cas 1: Extraction de données dynamiques simplifiées par l'attribution de groupes   Les données? Vous recevez une liste qui ressemble à Field_1 ci-dessous. Le PMID fait référence à un numéro d'identification pour un article de journal médical dans une base de données. Chaque FAU est un autre auteur sur le papier. Il peut y avoir n'importe quel nombre d'auteurs pour un papier.     Le but? Une table avec des numéros d'identification dans le premier champ et des colonnes correspondant aux auteurs.     Comment? Préparez les données en filtrant et en séparant l'identificateur. La troisième colonne ci-dessus, «Field_12», affiche les données utilisables. Utilisez l'outil Formule à plusieurs lignes pour identifier la colonne d'ID et les colonnes auteures de manière unique. Dans ce cas, chaque numéro d'identification est représenté par'0', et les auteurs sont comptés de zéro jusqu'à ce qu'ils atteignent un autre ID. Voir la colonne «en-têtes». Utilisez un autre Outil Formule à plusieurs lignes pour associer chaque groupe d'en-têtes les uns aux autres. Il s'agit fondamentalement d'un recordID-il identifie un seul document dans la base de données. Voir la colonne «groupes» ci-dessus. Tableau croisé dynamique! En utilisant ces colonnes d'identification, vous pouvez déplacer vos données de sorte que chacun des en-têtes crée une colonne et que chacun des groupes crée une ligne. Voir la fenêtre de confiiguration dans la première image ci-dessus.   Utilisez le cas 2: Effectuer des calculs de manière dynamique pour n'importe quel nombre de champs   Les données? Une poignée de champs numériques, illustrés ci-dessous. Ils sont regroupés par un champ Category et vous avez ajouté un champ recordID unique.     Le but? Moyennes roulante pour chaque colonne, dans leur catégorie respective.     Comment? Au lieu d'écrire une Formule à plusieurs lignes pour chaque colonne, Transposez tout dans une seule colonne, et ajoutez les champs clés "recordID" et "HP category". Voir la fenêtre de configuration dans la première image. Cela se traduit par la sortie ci-dessous. Bien qu'il puisse sembler encore plus difficile de travailler avec, cela vous permet de calculer une moyenne roulante en un seul coup. Utilisez un outil Formule à plusieurs lignes pour calculer une moyenne. Vous pouvez facilement éviter de ramasser les mauvaises valeurs en utilisant l'option Regrouper par – cochez la case «HP Category» et «Name». Assurez-vous également de définir "Valeurs de lignes inexistantes" à "ligne valide la plus proche". Restructurer à l'aide de l'outil Tableau croisé dynamique! (rergrouper par "recordID", en-tête "Name", données "R3")   Cas 3: Logique délicate simplifiée avec les méthodes Tableau croisé dynamique   Les données? Vous avez une liste de toutes les combinaisons possibles de 5 Articles. Pour chaque combinaison, un nombre de lignes correspondant au nombre d'éléments répertorie le poids et la valeur de chaque élément, c'est-à-dire La combinaison 123 sera représentée trois fois, avec des informations pour Item1, Item2 et Item3.     Le but? Vous souhaitez optimiser votre sélection d'articles pour répondre à certains critères, tels que le poids minimum et la valeur maximale.   Comment? Utilisez un outil Formule pour ajouter une colonne pour «poids» comme indiqué dans la première image. Utilisez Tableau croisé dynamique avec la méthode «Somme» pour trouver le poids combiné de tous les éléments de chaque combinaison. L'en-tête "Weight" regroupera toutes les valeurs "kg" ensemble, et le regroupement par "combinaisons" créera une ligne pour chaque combinaison. Répétez cette opération pour «value» ($). Astuce Pro: Renommage des champs     Un inconvénient de l'outil Tableau croisé dynamique est qu'il ne supporte avec des caractères spéciaux dans les en-têtes de champ, y compris les espaces. Cela signifie que si vous avez un en-tête de champ "a a", il sera effectivement sortir comme "a_a". Je sais que cela peut être un peu gênant, mais lors du développement du moteur Alteryx, nous avons privilégié la vitesse et l'efficacité au détriment de l'aspect esthétique des en-têtes de champs. Ne vous inquiétez pas-il ya une solution parfaitement faisable à ce problème (plus d'un fait!) qui fait usage d'un outil impressionnant appelé Attribution dynamique d'un nouveau nom. La façon suivante est la façon dont je préfère d'aborder ce sujet:     Pour les workflows affichés dans ces cas, veuillez consulter le paquet Alteryx supplémentaire. Notez que vous pouvez recevoir une erreur lors de l'extraction du contenu, mais cela n'affectera pas l'exécution du Workflow.   Maintenant, vous devriez avoir une compétence de niveau expert avec l'outil Tableau croisé dynamique! Si vous pouvez penser à un cas d'utilisation que nous avons oublié, n'hésitez pas à utiliser la section commentaires ci-dessous! Considérez-vous comme un Maître d'Outils déjà? Faites-nous signe à Community@alteryx.com si vous souhaitez que votre outil créatif soit présenté dans la série de Maîtrise d'Outils.   Restez à l'écoute de nos derniers messages chaque #ToolTuesday en suivant @Alteryx sur Twitter! Si vous souhaitez maîtriser tous les outils de Designer, considérez de vous abonner aux notifications par email. Parfois, vous regardez le gros stack de données devant vous et vous vous demandez comment vous pourrez l'obtenir sous la forme dont vous voulez. Chaque option semble de nécessiter beaucoup de travail manuel, et en tant que professionnel de données que vous êtes, c'est tout simplement quelque chose que vous n'allez pas supporter. Alteryx Designer
Afficher l'article complet
Filtrer à l'aide de données de chaîne Il existe une poignée de façons de rechercher une chaîne particulière dans un champ de données. Si vous souhaitez effectuer une requête, identifier les enregistrements avec un champ de chaîne particulier dans un champ de données: Utilisez l'outil filtre: le résultat sera deux flux de jour-les enregistrements qui répondent à vos critères de filtrage et ceux qui ne le font pas. Sur les fonctions trab, développez l'arborescence de chaînes et sélectionnez FindString (STR, target) Remplacer Str par le nom du champ Remplacez Target par la chaîne que vous cherchez à identifier Terminez l'expression avec! =-1 qui séparera les vraies valeurs des fausses. Exemple-si vous essayez d'identifier tous les clients avec Joe dans un champ de données, «Name»: FindString ([nom], "Joe")! =-1 Les enregistrements qui satisfont à ce critère seront déroulés dans le flux vrai (le nom contiendra la valeur «Joe»). Tous les autres enregistrements seront déroulés par le faux flux. Cette fonction peut également être utilisée dans l'outil de formule si, par exemple, vous avez voulu renseigner une colonne de données différente en fonction de ce champ de nom, vous pouvez utiliser la méthode FindString dans une instruction if. Exemple: vous souhaitez classer vos données dans un nouveau champ en fonction de l'instance des clients avec Joe dans un champ de données, «Name» IF (FindString ([nom], "Joe")! =-1) puis "Joe client" Else "autre" endif Cela va remplir un nouveau champ de données avec "Joe client" f le champ "nom" contient "Joe" sinon il remplira ce champ avec la valeur "Other" À partir des propriétés de configuration de l'outil de formule, ajoutez un nouveau champ en tapant un nouveau nom de champ dans la zone, ou choisissez un champ existant pour mettre à jour les données avec. Assurez-vous que le type de champ et la taille appropriés sont également spécifiques Sous l'onglet fonctions, développez l'arborescence conditionnelle et sélectionnez si c alors t else f endif Sous l'onglet fonctions, développez l'arborescence de chaînes et sélectionnez FindString (STR, target) pour remplacer c Remplacer Str par le nom du champ Remplacez Target par la chaîne que vous cherchez à identifier Terminez cette partie de l'expression avec! =-1 qui séparera les vraies valeurs des fausses Remplacez "t" par la valeur souhaitée pour remplir le nouveau champ si la condition est remplie: "client Joe" Remplacez "f" par la valeur désirée pour remplir le nouveau champ si la condition n'est pas remplie: "autre" Expression
Afficher l'article complet
Étiquettes