Community Spring Cleaning week is here! Join your fellow Maveryx in digging through your old posts and marking comments on them as solved. Learn more here!
Free Trial

Base de Connaissance

Apprenez auprès des experts.
TIPS de la semaine

Chaque semaine, découvrez de nouvelles astuces et bonnes pratiques pour devenir un expert !

Voir l'index

Top 10 Alteryx Server Foire aux questions

Community_Admin
Alteryx
Alteryx
Créé
Top 10 Alteryx Server Foire aux questions

Alteryx serveur est de plus en plus populaire que les dirigeants d'Analytics se pencher sur l'échelle de Alteryx pour s'attaquer à de plus grands projets, de plus grands ensembles de données et de mettre en libre-service l'analyse des informations dans les mains de plus de décideurs. Des organisations allant des petits détaillants et des fournisseurs de données de niche, à de grandes sociétés telles que Southwest Airlines, chic-fil-A et Western Union ont amélioré à Alteryx Server pour améliorer la productivité des analystes et améliorer la prise de décision.

En tant qu'analyste de ligne d'affaires, vous savez probablement que vous devez faire votre entreprise de pratique d'Analytics prête, et peut-être vous avez commencé à regarder le serveur de Alteryx et a commencé à penser aux prochaines étapes. À ce stade, nous commençons à obtenir plus de questions sur les meilleures pratiques pour déployer Alteryx Server, comment il balance, questions de gouvernance et bien plus encore. J'ai donc récemment assis avec nos experts Alteryx serveur leader, Kory Cunningham, Senior Product Manager pour Alteryx Server et Gary Schwartz et Steve Ahlgren qui sont le développement conduit pour Alteryx Server, pour obtenir les réponses à certains de nos plus fréquemment demandé questions (FAQ). Voici les commentaires que nous avons reçus de l'équipe.

Merci pour la lecture,

Josh Howard, SR. Product Marketing Manager

Quelles sont les principales fonctionnalités du serveur Alteryx que quelqu'un pourrait intéresser?

Kory Cunningham-il ya tout à fait quelques choses, mais l'une des caractéristiques les plus convaincants est juste la possibilité de tirer parti du matériel serveur afin que vous puissiez déployer votre analyse à l'échelle et de soutenir les utilisateurs simultanés. Nous avons vu Alteryx serveur déployé dans de petites boutiques d'Analytics Boutique cinq personnes à des entreprises multinationales avec des centaines d'utilisateurs. La seconde est autour de l'ordonnancement. Le planificateur vous donne la possibilité de prendre des workflows et des processus analytiques et les planifier pour fonctionner à l'avenir pour plus de rapports en temps opportun, et de le gérer de manière automatisée pour les rapports quotidiens, hebdomadaires, mensuels. La troisième est la Galerie. La Galerie est une interface Web où vous pouvez prendre Alteryx workflows et les publier jusqu'à une galerie de partager avec d'autres collègues et les utilisateurs d'entreprises pour obtenir ce même traitement analytique, mais sans avoir Alteryx installé sur leur bureau. Par exemple, vous pouvez avoir quelqu'un dans le champ Connectez-vous à un navigateur Web, accéder à la Galerie et exécuter leurs rapports sans Alteryx designer. Dans la plateforme Galerie, vous disposez également de la collaboration et du contrôle de version sur les workflows. Vous pouvez partager, modifier et garder une trace de ces changements par l'utilisateur et quand le changement a eu lieu. Cela fait partie de la plate-forme serveur Alteryx.

Parlez-moi des configurations de déploiement prises en charge dans Alteryx Server. Peut-elle être déployée dans un environnement virtuel?

Gary Schwartz-en ce qui concerne la configuration de déploiement, nous sommes sur une pile Microsoft, il est donc toutes les fenêtres. Nous soutenons Windows Server 2008 R2 et plus tard, et vous pouvez voir les spécifications techniques recommandées sur notre page TechSpecs. En ce qui concerne le déploiement, nous vous recommandons certainement d'exécuter le serveur sur du métal nu, mais vous pouvez également exécuter le serveur dans des environnements virtualisés. En fait, nous dirigeons notre propre galerie dans un environnement virtualisé sur Amazon. Nous faisons des tests sur certains environnements virtuels, mais nous n'avons pas de certification technique du serveur sur ces environnements. Ainsi, le serveur Alteryx fonctionne bien sur des environnements physiques et virtuels. La chose que vous devez penser est la contention de ressource sur la boîte physique. Si elle est exécutée sur une boîte physique qui est partagée par beaucoup, alors vous pouvez obtenir une certaine contention des ressources. Vous devez également considérer les UC vs vCPUs. Par exemple, en Amazon vous pourriez avoir 4, 8, ou 16 CPU, mais ce qu'ils font vraiment référence à sont vCPUs, qui est la moitié d'un processeur réel, et nos spécifications sont basées sur les processeurs physiques. Donc, c'est quelque chose que vous devez garder à l'esprit.

Quels types d'authentification sont fournis? SSO est-il disponible?

Kory Cunningham-en ce qui concerne la Galerie, il ne supporte deux formes principales d'authentification. L'un est construit dans l'authentification, qui est juste e-mail et mot de passe que les utilisateurs peuvent se connecter en utilisant leur propre compte qu'ils ou l'administrateur crée. Mais nous soutenons également l'authentification Windows, y compris la prise en charge native de NTLM et Kerberos. Cela permet aux utilisateurs de la Galerie de se connecter en utilisant les mêmes informations d'identification qu'ils utilisent probablement pour se connecter à leur propre machine, et de tirer parti de votre Active Directory existant pour l'authentification et la gestion des utilisateurs pour accéder à la Galerie. Et avec 10,5, nous avons également introduit la possibilité d'exécuter des workflows en tant qu'utilisateur, de sorte qu'un utilisateur peut exécuter un workflow en utilisant leurs propres informations d'identification plutôt que d'utiliser un compte administrateur serveur global et seulement obtenir l'accès aux données qu'ils ont été permissiond pour.

Combien d'utilisateurs ou d'applications un handle de déploiement peut-il avoir?

Steve Ahlgren-la réponse courte est que nous pouvons manipuler un nombre illimité d'utilisateurs avec une certaine limite supérieure, et nous avons des clients avec des centaines d'utilisateurs sur le serveur de Alteryx. Mais, plutôt que le nombre d'utilisateurs, peut-être il est plus important de considérer le nombre et les types d'apps qui peuvent être manipulés. La bonne chose au sujet du serveur est qu'il balance linéairement, de sorte que vous pouvez jeter plus de ressources à elle pour gérer une charge accrue. Si vous avez du matériel ou du matériel virtuel disponible, nous pouvons remplir cette instance à sa capacité en fonction de ce que votre charge prévue est. Le nombre d'utilisateurs simultanés est limité par vos services frontaux fournis par votre infrastructure interne ou Cloud. Si vous avez un équilibreur de charge, nous pouvons échelle pour manipuler les deux extrémités avant et arrière de charge.

Comment l'échelle du serveur Alteryx?

Steve Ahlgren-il ya trois points principaux de l'évolutivité et je vais les énumérer par ordre de probabilité:

  • Ajout de fonctionnalités de traitement de workflow à une instance de serveur. Nous appelons ces ouvriers de file d'attente ou les ouvriers de rendu, qui sont des instances de matériel physique ou virtuel qui traitent les workflows de Alteryx et rendent les tuiles de carte, respectivement. Les travailleurs de file d'attente exécutent le même moteur Alteryx qui s'exécute sous le produit concepteur Alteryx. Il existe deux façons principales de les mettre à l'échelle, l'un est horizontalement, ce qui ajoute plus de travailleurs physiques ou virtuels à une instance de serveur et la deuxième façon de mettre à l'échelle est l'évolutivité verticale, ce qui ajoute plus de capacité de travail à un nœud physique existant ou ajout de matériel à un nœud physique existant. Nous soulignons que la plupart des gains de performances seront réalisés par l'évolutivité horizontale, en ajoutant plus de matériel physique et de travailleurs physiques à une instance de serveur existante.
  • La deuxième façon de l'échelle est d'étendre la base de données backend, qui dans notre cas est MongoDB. MongoDB a plusieurs types d'options d'évolutivité pour la redondance et les performances, et l'un de ceux-ci est par le biais de jeux de réplicas. Ensembles de réplicas est une manière Mongo obtient la fiabilité et la redondance des données en écrivant essentiellement des données à plusieurs noeuds en même temps pour s'assurer qu'il y a au moins une copie de vos données dans l'existence en tout temps. Si un noeud tombe, alors un nouveau noeud prendra sa place et le serveur devrait être en mesure de rester opérationnel. Vous pouvez également mettre à l'échelle la base de données par l'éclat. L'éclat est plus performant et il permet potentiellement l'utilisation de plus petites tailles de disque qui est important si vous utilisez le matériel virtualisé dans une infrastructure de type Amazon
  • La troisième façon de l'échelle est à travers la Galerie. La Galerie est le service frontal qui gère les demandes des utilisateurs à partir du client ou du navigateur Web. C'est la façon la moins probable à l'échelle, car il n'a pas tendance à être un goulot d'étranglement, et il dépend du type d'utilisateurs et d'applications qui sont en cours d'exécution, mais il est possible d'évoluer à l'aide d'un équilibreur de charge. En fait, nous avons utilisé ces trois méthodes de mise à l'échelle déployées sur notre propre instance de la galerie publique Alteryx.

Quel type de matériel ou de spécifications réseau sont nécessaires?

Kory Cunningham-vous pouvez trouver toute notre documentation technique de http://downloads.alteryx.com/, mais pour une installation typique, nous vous recommandons un Quad Core, machine CPU unique avec 2,5 GHz et au moins 16 Go de RAM (ou plus) et un disque SSD (Solid State Drive). Le SSD fait une différence assez grande avec la rapidité avec laquelle les données peuvent lire ou écrire. L'autre chose à considérer est la topologie du réseau en ce qui concerne l'emplacement du DataSet. Par exemple, si vous achetez nos données de tierce partie (par exemple Experian) il peut être installé sur la même machine que le logiciel serveur et dans un emplacement réseau. Mais l'installer sur le serveur sera votre meilleure option pour la performance et l'avoir aussi près du moteur d'exécution ou de l'espace de calcul que possible. Mais nous permettons aux données d'être stockées sur un réseau qui permet aux données d'être stockées dans un emplacement distant qui est commode pour avoir plusieurs machines Remoting-in pour accéder à ces données et la mise à jour, mais il ne viennent à une pression significative sur les performances et vous serez l ikely voir dégradation. En ce qui concerne le saut de réseau ou les liens qui doivent se produire dans un déploiement à plusieurs nœuds, vous voulez vous assurer que ceux-ci sont conservés au minimum. Essayez donc de garder les machines aussi rapprochées que possible pour éviter la latence.

Gary Schwartz-une autre chose à penser en ce qui concerne le réseau et le serveur que la Galerie est en cours d'exécution, est de configurer un nom de domaine approprié que les utilisateurs peuvent accéder et pointant vers le serveur de droite. Nous avons vu beaucoup d'exemples où le DNS était incorrect et ils ne pouvaient pas comprendre pourquoi ils ne pouvaient pas atteindre leur galerie. En plus de la Galerie, nous vous recommandons d'utiliser SSL ou TLS, ce qui signifie que vous devez installer un certificat sur le serveur qui héberge la galerie à moins que vous ne travailliez derrière un équilibreur de charge. Travaillez avec votre équipe informatique pour obtenir le certificat SSL installé, ce qui peut être intensif. La dernière chose est, le domaine que la Galerie est en cours d'exécution sur les besoins du niveau approprié de la stratégie de confiance définie avec les autres domaines que les autres utilisateurs travailleront sur afin que Active Directory peut résoudre et déterminer les autorisations en fonction de cela.

Existe-t-il des exigences de serveur Web ou de base de données tierce partie?

Kory Cunningham – le serveur a empaqueté tous les composants nécessaires (par exemple, serveur Web et base de données) dans l'architecture ou l'installation elle-même. Ainsi, tout peut être installé et configuré à partir de l'installation du serveur. Pour un seul nœud machine, il n'y a pas de dépendances supplémentaires, mais vous pouvez commencer à voir certaines exigences 3ème partie avec un environnement à plusieurs nœuds si vous l'échelle-out. Si vous l'échelle de la Galerie par exemple, vous aurez besoin de mettre en place un équilibreur de charge pour gérer l'ensemble du trafic Web-à Alteryx nous utilisons Amazon équilibreur de charge élastique, mais vous pouvez utiliser quelque chose comme F5 réseaux ou quel que soit votre service informatique utilise. Si vous dimensionnez la base de données, comme mentionné ci-dessus, nous ne paquet vers le haut d'une version incorporée de MongoDB. Mais si vous commencez à tirer profit des ensembles de réplique de Mongo pour la haute disponibilité, la redondance et la fiabilité, alors vous auriez besoin de gérer votre propre noeud de base de données Mongo. Et nous vous recommandons de jeter un oeil à Mongo's specs, l'installation et les meilleures pratiques pour mettre en place. Mais à part ça, il n'y a pas de 3ème partie.

Gary Schwartz-je voudrais également mentionner que nous obtenons beaucoup de questions sur le serveur Web. Bien que nous fassions l'empaquetage du serveur Web et de la base de données dans l'architecture, la Galerie est un service Web Self-Hosted. Il n'utilise rien comme Tomcat ou Apache, il s'agit d'un service Web autonome qui s'inscrit avec la configuration d'adresse de base qui écoute la demande Web à partir de cet emplacement.

Comment puis-je gérer la haute disponibilité et les sauvegardes de données?

Gary Schwartz-pour une haute disponibilité il s'agit de redondance dans l'architecture, et puisque l'architecture est conçue pour évoluer horizontalement la plate-forme le soutient. Du point de vue de la Galerie, vous pouvez mettre à l'échelle pour avoir plusieurs noeuds de Galerie derrière un équilibreur de charge. Si un noeud échoue, alors il prendra toujours le trafic tandis que vous récupérez l'autre et le récupérez vers le haut et l'exécution. Deuxièmement, retour à ce que Steve a dit au sujet de gagner le débit supplémentaire des workflows en scalant dehors vos noeuds de travail ... Plus vous avez de nœuds de travail, plus vous avez de disponibilité pour exécuter des workflows. Vous voulez donc surveiller l'utilisation de votre système. Si vos nœuds de travail fonctionnent continuellement à pleine capacité, vous devez ajouter plus de nœuds de travail pour plus de capacité. Nous vous recommandons certainement de sauvegarder vos données. La première étape de ce faire est de mettre à l'échelle de votre base de données Mongo intégré pour se lever plusieurs ensembles de répliques Mongo sur des noeuds distincts qui vous donnera une sauvegarde immédiate et la redondance. Nous vous recommandons également de suivre la recommandation de Mongo pour les sauvegardes. Il y a plusieurs stratégies pour cela. Nous utilisons régulièrement des intervalles de sauvegardes incrémentielles afin que nous ayons une sauvegarde de base avec des instantanés incrémentiels le long du chemin sans avoir à faire des sauvegardes complètes tout le temps. Ensuite, nous faisons parfois des sauvegardes complètes.

Kory Cunningham – nous avons une disponibilité de sauvegarde et de restauration des installations pour les fonctionnalités de sauvegarde de base dans l'instance MongoDB incorporée. Mais si vous êtes à la recherche d'une solution de haute disponibilité qui est hautement redondante, alors nous vous recommandons de descendre le chemin d'un déploiement à plusieurs nœuds gérés par l'utilisateur d'un déploiement MongoDB.

Steve Ahlgren-je voudrais également ajouter que si vous êtes en cours d'exécution dans AWS, je voudrais mettre en place la distribution régionale. Amazon a des pannes. Même dans notre propre galerie publique, nous avons vu des pannes et que la distribution régionale assure que nous avons près de 100% de disponibilité. En termes de sauvegardes, la configuration des instantanés EBS est facile si vous êtes en cours d'exécution dans EC2. Vous pouvez configurer ces instantanés EBS et des sauvegardes complètes chaque semaine ou tous les deux jours.

Comment surveiller un déploiement de serveur?

Steve Ahlgren – il existe plusieurs façons différentes de surveiller les déploiements. Chaque composant du serveur possède sa propre infrastructure de journalisation. La Galerie frontale écrit ses propres journaux, le back-end a également sa propre structure en utilisant les niveaux syslog, et la base de données Mongo a sa propre structure de journalisation. Il y a donc une grande exploitation forestière dans chaque niveau de l'architecture du serveur. Nous suggérons que tout le monde recueille ces logs et utilise Alteryx. Alteryx utilise Alteryx pour collecter nos propres logs. Nous avons également siphonner les logs dans Amazon S3 où ils peuvent être importés dans des outils tiers comme Logstash et loggly mais Alteryx est probablement l'ensemble de l'outil de journalisation dont vous aurez besoin pour cela. En termes d'autres capacités de surveillance, nous recommandons également d'utiliser des services comme Amazon CloudWatch pour surveiller la santé du système comme CPU et la mémoire, qui vous donnera une indication précoce des problèmes ou des problèmes. Nous recommandons également la surveillance de base de données backend avec MongoDB Cloud Manager pour la surveillance des choses comme les requêtes lentes et l'accès aux données avec une pagination extensive, qui peuvent tous deux indiquer un problème. Un autre outil de surveillance 3ème partie que nous utilisons est une nouvelle relique, que nous utilisons pour surveiller les nœuds frontaux dans une architecture de serveur à plusieurs niveaux. Nous utilisons les deux nouvelles relique dans une combinaison avec Amazon CloudWatch pour surveiller la santé de la machine pour des choses comme les processus de Galerie de clés, la charge CPU lourde ou le trafic réseau. Mais nous avons aussi empaqueter un serveur d'utilisation de rapports et de surveillance app qui s'exécutent dans Alteryx sur le serveur pour surveiller les choses comme le nombre d'utilisateurs actuels, le nombre moyen d'emplois en attente dans la file d'attente d'exécution, la longueur de temps qu'il faut des emplois à courir-donc Monitori de base ng qui serait utile dans la gestion du serveur.

Quelles sont les autorisations d'utilisateur et les contrôles d'accès aux données disponibles?

Kory Cunningham-à l'intérieur de la Galerie, vous pouvez gérer les utilisateurs et de fournir ces utilisateurs avec différents niveaux d'accès aux données pour les différents rôles d'utilisateur. De votre visionneuse de base, qui est une vue de niveau de base que l'accès à la Galerie où ils peuvent juste exécuter des workflows, à ce que nous appelons l'artisan, qui sont les utilisateurs qui contribuent le contenu et le téléchargement de workflows et la création d'applications dans la Galerie de partager avec d'autres utilisateurs, et enfin à ce que nous appelons le rôle de conservateur, qui est que l'administration et le rôle de gestion qui gère la Galerie. Pour les artisans qui créent du contenu, les workflows sont stockés dans ce que nous appelons les «Studios». Les studios sont essentiellement des dossiers de projet restreints où plusieurs analystes peuvent partager et de collaborer et de publier des workflows que seulement ils peuvent voir. À partir de là, ils peuvent partager ces workflows à d'autres studios ou avec d'autres utilisateurs, offrant ainsi un moyen de contrôler la gestion de l'accès aux données. Avec Alteryx Server, nous respectons les règles et niveaux d'autorisation que vous définissez au niveau de la base de données. Nous vous donnons donc la possibilité de définir des autorisations globales auxquelles tous les workflows s'exécutent. Mais dans la version 10,5, nous avons fourni une plus grande souplesse vous donnant la possibilité de définir des autorisations au niveau individuel que les workflows s'exécutent ainsi. Nous continuons à étendre nos capacités ici, alors restez à l'écoute pour les prochaines versions! (note des éditeurs: consultez la vidéo de kory sur le respect de la gouvernance des données avec l'analyse des données libre-service pour plus d'informations)

C'est tout pour l'instant. Merci!

Grand Merci à Kory, Gary et Steve pour s'asseoir avec moi et répondre à quelques-unes des questions que nous obtenons sur Alteryx Server. Si vous avez plus de questions, n'hésitez pas à nous demander ici sur la communauté ou de télécharger le rapport, "Alteryx Server: mise à l'échelle de l'analyse des données libre-service pour l'entreprise".

Josh Howard

Alteryx serveur est de plus en plus populaire que les dirigeants d'Analytics se pencher sur l'échelle de Alteryx pour s'attaquer à de plus grands projets, de plus grands ensembles de données et de mettre en libre-service l'analyse des informations dans les mains de plus de décideurs. Mais le serveur Alteryx peut-il être déployé dans un environnement virtuel? Combien d'utilisateurs peut-il gérer? Comment l'échelle du serveur Alteryx? J'ai récemment assis avec la gestion des produits Alteryx Server et le développement conduit à répondre à ces questions et plus encore. En savoir plus sur le Top 10 Alteryx serveur Foire aux questions.

10,5
Étiquettes