コミュニティ
キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 

ナレッジベース - 日本語

エキスパートから学ぶ。

Alteryx Server よくある質問トップ10

アステロイド
Created on

分析リーダーたちがAlteryxをスケールアウトして、より大きなプロジェクト、より大きなデータセットに取り組み、セルフサービスのデータ分析がより多くの意思決定者の手に渡ることから、Alteryx Serverの人気がますます高まっています。小規模小売店やニッチデータプロバイダから、サウスウエスト航空Chic-fil-Aウェスタンユニオンなどの大企業まで、さまざまな組織がアナリストの生産性および意思決定の向上のためにAlteryx Serverにアップグレードしました。

 

LOBアナリストの方は分析プラクティスをエンタープライズ対応にする必要があることをご存知でしょう。その後、Alteryx Serverを検討し始め、次のステップについて考え始めたかもしれません。現時点で、Alteryx Serverを展開するためのベストプラクティス、スケーリング、ガバナンスに関する多くのご質問をいただいております。そこで私は最近、Alteryx Serverのエキスパートのリーダー達、Alteryx ServerシニアプロダクトマネージャーのKory Cunningham、そしてAlteryx Server開発リーダーのGary SchwartzとSteve Ahlgrenを迎えて、よくある質問(FAQ)に回答してもらいました。チームからのフィードバックをご紹介します。

 

最後までお読みいただき、有難うございました。

Josh Howard, Sr. プロダクトマーケティングマネジャー

 

人々の関心が高いAlteryx Serverの主な機能は何ですか?

 

KoryC.pngKORY CUNNINGHAM - いくつかありますが、最も魅力的な機能の1つは、サーバーハードウェアを活用することができるため、分析を大規模に展開して同時ユーザーをサポートできることです。店舗の分析をする小規模な従業員5名のブティックから、何百人ものユーザーを抱える多国籍企業で展開されたAlteryx Serverを見てきました。2つ目はスケジューリング関連の機能です。スケジューラを使用すると、ワークフローと分析プロセスの実行、また、よりタイムリーなレポート作成を将来実行するようにスケジュールし、日単位、週単位、月単位のレポートを自動管理します。3つ目はギャラリーです。ギャラリーは、Alteryxのワークフローをギャラリーに公開して他の同僚やビジネスユーザーと共有できるWebインタフェースです。Alteryxをデスクトップにインストールしなくても、同じ分析処理を実行できます。たとえば、フィールドにいる誰かにWebブラウザにログオンしてGalleryにアクセスしてもらうと、Alteryx Designerなしでレポートを実行することができます。ギャラリープラットフォーム内では、ワークフローのコラボレーションとバージョン管理も可能です。変更が行われたときに、それらの変更をユーザーごとに共有、変更、および追跡することができます。これはAlteryx Serverプラットフォーム全ての機能のほんの一部です。

 

Alteryx Serverでサポートされている展開構成について教えてください。仮想環境での展開は可能でしょうか?

 

GaryS.pngGARY SCHWARTZ – 展開構成に関しては、マイクロソフトのスタック上にあるので、すべてWindowsです。Windows Server 2008 R2以降をサポートしており、TechSpecsページで推奨される技術仕様をご確認いただけます。 展開に関しては、サーバーをベアメタルで実行することをお勧めしますが、仮想環境でもサーバーを実行できます。実際、私たちはAmazonの仮想環境でギャラリーを実行しています。一部の仮想環境でテストを行っていますが、それらの環境ではサーバを技術的に認証していません。Alteryx Serverは物理環境および仮想環境の両方でうまく機能します。考慮すべきことは、物理的ボックスのリソースの競合です。多くの人が共有している物理ボックス上で実行する場合、リソースの競合が発生する可能性があります。また、CPUとvCPUを考慮する必要もあります。例えば、Amazonでは、4、8、または16個のCPUがある場合でも、実際にそれらが参照するのはvCPUです。これは実際のCPUの半分であり、私たちのスペックは物理CPUに基づいています。そのため、このことを覚えておく必要があります。

 

どのような種類の認証が提供されていますか?SSOは利用可能ですか?

 

KoryC.pngKORY CUNNINGHAM - ギャラリーに関しては、2つの主要な認証をサポートしています。1つはビルトイン認証です。これは、ユーザーまたは管理者が作成した自分のアカウントを使用して、ユーザーがサインインできるEメールとパスワードです。しかし、NTLMとKerberosのネイティブサポートを含む、Windows認証もサポートしています。これにより、ギャラリーユーザーは、自分のマシンへのログオンに使用するのと同じ資格情報を使用してログオンし、認証およびユーザー管理に既存のアクティブディレクトリを利用してギャラリーにアクセスできます。また、10.5では、ユーザーとしてワークフローを実行する機能も導入されました。ユーザーは、グローバルサーバー管理者アカウントを使用するのではなく、自分の認証情報を使用してワークフローを実行し、許可されたデータにのみアクセスできます。

 

1つの展開で処理可能なユーザー数やアプリの数はいくつですか?

 

SteveA.pngSTEVE AHLGREN – 簡単に言えば、上限を設定して無制限の数のユーザーを処理できるということです。また、Alteryx Serverには何百ものユーザーを持つクライアントがあります。ただし、ユーザー数よりも、処理できるアプリの数と種類を検討することの方が重要です。Serverの良いところは、Serverが直線的に拡張されることです。負荷が増加しても処理できるため、より多くのリソースを投入することができます。利用可能なハードウェアまたは仮想ハードウェアがある場合は、予想される負荷に応じて、その容量までインスタンスを満たすことができます。同時ユーザー数は、内部またはクラウドインフラストラクチャによって提供されるフロントエンドサービスによって制限されます。ロードバランサーをお持ちの場合は、フロントエンドとバックエンドの両方の負荷を処理するようにスケールできます。

 

Alteryx Serverはどのようにスケールできますか?

 

SteveA.pngSTEVE AHLGREN – スケーラビリティには主に3つのポイントがあります。可能性の高い順にご紹介します。

  • サーバーインスタンスへのワークフロー処理機能の追加。これらをQueue WorkersまたはRender Workersと呼びます。これらはそれぞれAlteryxワークフローを処理し、マップタイルをレンダリングする物理または仮想ハードウェアのインスタンスです。Queue WorkersはAlteryx Designer製品下で動作するのと同じAlteryxエンジンを実行します。これらをスケーリングするには、主に2つの方法があります。1つは水平方向にスケールアウトすることです。これは、サーバーインスタンスに物理的または仮想的なワーカーを追加することを意味します。2つ目の方法は、垂直方向にスケールアップすることです。これは、既存の物理ノードにより多くのワーカー容量を追加するか、既存の物理ノードにより多くのハードウェアを追加することです。パフォーマンスの向上には、ほとんどの場合、水平方向にスケールアウトし、既存のサーバーインスタンスに物理的なハードウェアと物理的なワーカーを追加することによって達成されることを重視しています。
  • 2つ目のスケール方法は、バックエンドデータベースをスケーリングすることです。この例ではMongoDBを使用します MongoDBには、冗長性とパフォーマンスのためのスケーラビリティオプションがいくつかあります。そのうちの1つがレプリカセットによるものです。レプリカセットは、データのコピーが常に少なくとも1つ存在するように、同時に複数のノードにデータを書き込むことによって、Mongoがデータの信頼性と冗長性を実現する方法です。ノードが落ちた場合は新しいノードが代わりになり、サーバーは稼働し続けることができます。シャーディングによってデータベースをスケールすることもできます。シャーディングは性能がより高く、小さいディスクサイズの使用を可能にします。これは、Amazonタイプのインフラストラクチャで仮想ハードウェアを使用している場合に重要です。
  • 3つ目は、ギャラリーを使用するスケーリング方法です。ギャラリーはクライアントまたはWebブラウザからのユーザー要求を処理するフロントエンドサービスです。これは、スケーリング時に使われる可能性が最も低い方法です。ボトルネックになりにくいからです。実行しているユーザーやアプリケーションの種類にもよりますが、ロードバランサを使用してスケールすることは可能です。私たちはこれら3つのスケーリング方法全てを実際にAlteryx Public ギャラリーのインスタンスに展開して使用しました。

 

どのような種類のハードウェアまたはネットワーク仕様が必要ですか?

 

KoryC.pngKORY CUNNINGHAM – 技術に関する全てのドキュメントはこちらからご覧いただけます。http://downloads.alteryx.com/ しかし一般的なインストールでは、2.5GHz以上の16GB以上のRAMとソリッドステートドライブ(SSD)を搭載したクアッドコアのシングルCPUマシンを推奨します。実際にSSDはデータの読み書き速度にかなり大きな違いをもたらします。もう1つ考慮すべきことは、データセットの場所に関連するネットワークトポロジです。例えば、もしサードパーティデータを購入する場合、(例: エクスペリアン(Experian))Serverソフトウェアと同じマシンとネットワーク上の場所の両方にインストールできます。しかし、Serverにインストールするのはパフォーマンスのための最善の選択肢であり、またそれを実行エンジンまたは計算スペースにできるだけ近づけることです。しかし、データをネットワーク上に保存することを許可しているので、データをリモートに保存することができます。データにアクセスして更新するために複数のマシンをリモートで接続するには便利ですが、大きな負荷がかかり、パフォーマンスが低下する可能性があります。マルチノード展開で発生させる必要があるネットワークホップまたはリンクに関しては、それらを最小限に抑えるようにします。そのため、レイテンシーを回避するために、マシンをできるだけ近づけて配置するようにしてください。

 

GaryS.pngGARY SCHWARTZ – ギャラリーが実行されているネットワークとサーバーに関して考えるべきもう1つのことは、ユーザーがアクセスして正しいサーバーを選ぶことができる適切なドメイン名を設定することです。DNSが正しくない例を数々見てきましたが、彼らはなぜギャラリーにアクセスできないのかを理解できませんでした。さらにギャラリーでは、SSLまたはTLSを使用することをお勧めします。つまり、ロードバランサーの背後で作業している場合を除き、ギャラリーをホストしているサーバーに証明書をインストールする必要があります。ITが集約している可能性があるため、ITチームと協力してSSL証明書をインストールします。最後に、ギャラリーが実行されているドメインには、他のユーザーが作業する他のドメインと適切なレベルの信頼ポリシーを設定して、アクティブディレクトリがそれに基づいてアクセス許可を決定できるようにする必要があります。

 

サードパーティのWebサーバーまたはデータベースの要件はありますか?

 

KoryC.pngKORY CUNNINGHAM – Serverは、アーキテクチャまたはインストール自体に必要なすべてのコンポーネント(Webサーバーやデータベースなど)をパッケージ化しています。そのため、Serverのインストールで全てをインストールして設定することができます。シングルノードマシンの場合、追加の依存関係はありません。ただし、スケールアウトすると、マルチノード環境でサードパーティの要件がいくつか発生する可能性があります。例えば、ギャラリーをスケールアウトする場合は、すべてのWebトラフィックを処理するためのロードバランサーを設定する必要があります。AlteryxではAmazonのElastic Load Balancerを使用していますが、F5 NetworksなどのIT部門が使用するものも使用できます。上記のようにデータベースをスケールアウトする場合は、MongoDBの埋め込みバージョンをパッケージ化します。しかし、高可用性、冗長性、および信頼性のためにMongoのレプリカセットの利用を開始する場合は、独自のMongoデータベースノードを管理する必要があります。設定の際には、Mongoのスペック、インストール、そしてベストプラクティスを見ることをお勧めします。それ以外に、サードパーティの要件はありません。

 

GaryS.pngGARY SCHWARTZ – Webサーバーについても多くの質問が寄せられています。Webサーバーとデータベースをアーキテクチャーにパッケージ化する一方で、ギャラリーは自己ホスト型Webサービスです。TomcatやApacheのようなものを使用しているのではなく、その場所からのWeb要求を、待機するベースアドレス設定に登録する自己ホスト型Webサービスです。

 

 

 

高可用性とデータバックアップを管理する方法は?

 

GaryS.pngGARY SCHWARTZ – 高可用性とはアーキテクチャの冗長性のことであり、アーキテクチャは水平方向にスケールするように設計されているため、プラットフォームはそれをサポートしています。ギャラリー側からは、ロードバランサーの背後に複数のGalleryノードを配置するようにスケールできます。一方のノードに障害が発生した場合、もう一方のノードを復旧して稼働させるまでの間、トラフィックが発生します。次に、Steveがワーカーノードをスケールアウトすることで、ワークフローのスループットをさらに向上させることについて述べたところに戻ると、ワーカーノードが多ければ多いほど、ワークフローを実行するための可用性が高くなります。そのため、システムの使用状況の監視が必要になります。ワーカーノードが継続的に全容量で稼働している場合は、キャパシティを増やすためにワーカーノードを追加する必要があります。もちろんデータをバックアップすることをお勧めします。そのための最初のステップは、組み込みのMongoデータベースをスケールアウトして、別々のノードに複数のMongoレプリカセットを立ち上げることです。これにより、即時のバックアップと冗長性が得られます。Mongoの推奨バックアップに従うことをお勧めします。これにはいくつかの戦略があります。  定期的な増分バックアップを使用しているので、フルバックアップを常時実行する必要はなく、途中で増分スナップショットを含む基本バックアップを使用できます。そうして時々フルバックアップをします。

 

KoryC.pngKORY CUNNINGHAM – 組み込みMongoDBインスタンスの基本的なバックアップ機能では、バックアップおよび復元機能を利用できます。しかし、冗長性の高い高可用性ソリューションをお求めの場合は、MongoDBデプロイメントのユーザー管理のマルチノード展開方法をとることをお勧めします。

 

 

SteveA.pngSTEVE AHLGREN – AWSを使用している場合は、地域別配信も設定します。Amazonは停止することもあります。私たちのパブリックギャラリーでさえ、機能停止となることがあります。地域別配信を持つことでほぼ100%のアップタイムを持つことが保証されます。バックアップに関しては、EC2で実行している場合はEBSスナップショットの設定は簡単です。週単位または日単位にて、これらのEBSスナップショットとフルバックアップを設定できます。

 

 

 

サーバーデプロイメントをどのように監視していますか?

 

SteveA.pngSTEVE AHLGREN – デプロイメントを監視する方法はいくつかあります。サーバー内のすべてのコンポーネントには独自のロギングインフラストラクチャーがあります。フロントエンドギャラリーは自身のログを書き、バックエンドもsyslogレベルを使った自身の構造を持ち、そしてMongoデータベースも自身のログ構造を持っています。  そのため、サーバーアーキテクチャのすべての層に豊富なログ記録があります。全員がこれらのログを収集してAlteryxを使用することをお勧めします。AlteryxはAlteryxを使って私たち自身のログを収集しています。私たちはまた、LogstashLogglyのようなサードパーティ製のツールにインポートできるAmazon S3からもログを抽出しますが、おそらくこれに必要なロギングツールはAlteryxがあれば事足りることでしょう。その他の監視機能に関しては、Amazon CloudWatchなどのサービスを使用してCPUやメモリなどのシステム状態を監視することをお勧めします。これにより、問題やトラブルを早期に表示させることができます。また、MongoDB Cloud Managerを使用したバックエンドデータベースモニタリングもお勧めします。遅いクエリや広範囲のページングによるデータへのアクセスなどを監視するためのもので、どちらも問題を表示してくれます。この他に私たちが使用しているサードパーティ監視ツールはNew Relicです。これは、多層サーバーアーキテクチャのフロントエンドノードを監視するために使用します。重要なギャラリープロセス、重いCPU負荷、ネットワークトラフィックなどのマシンの健全性を監視するために、Amazon CloudWatchと組み合わせてNew Relicを使用しています。しかし、私たちはサーバー上のAlteryx内で実行される、サーバー使用状況報告および監視アプリのパッケージ化もしています。これは、現在のユーザー数、実行キューで待機している平均ジョブ数、ジョブの実行にかかる時間等、サーバーの管理に役立つ基本的な監視をするために、サーバー上のAlteryx内で実行されます。

 

どのようなユーザー許可とデータアクセス制御が必要ですか?

 

KoryC.pngKORY CUNNINGHAM - ギャラリー内では、ユーザーを管理し、それらのユーザーにロールによって様々なデータアクセスの規定を行うことができます。ワークフローを実行できるギャラリーにのみアクセスできる基本レベルのビューである基本ビューアー(Viewer)から、コンテンツを提供したり、ワークフローをアップロードしたり、ギャラリーでアプリケーションを作成して他のユーザーと共有したりするアルティザン(Artisan)と呼ばれるユーザーまで、そして最後に、私たちがキュレーターロール (Curator role) と呼ぶもの、つまりギャラリーを管理する管理および管理ロールがあります。コンテンツを作成しているアーティサンのワークフローは私たちが「スタジオ」と呼ぶものに保存されます。スタジオは基本的に制限されたプロジェクトフォルダで、複数のアナリストが共有や共同作業、そして彼らのみが見ることができるワークフローを公開できます。そこから、それらのワークフローを他のスタジオまたは他のユーザーと共有することができ、さらにデータアクセス管理を制御する方法を提供します。  Alteryx Serverでは、データベースレベルで設定したルールと許可レベルを尊重します。そのため、すべてのワークフローが実行される、グローバル権限を設定する機能が使用できるようになっています。10.5リリースでは、ワークフローが実行される個々のレベルで権限を設定できるようになり、柔軟性がさらに向上しました。引き続き、機能を拡大していきますので今後のリリースにご期待ください!(編集者注:詳細はKoryのビデオセルフサービスのデータ分析によるデータガバナンスの尊重をご覧ください。

 

今回はここまでです。どうもありがとうございました!

 

Alteryx Serverについて、質問に答えてくれたKory、Gary、そしてSteveに感謝します。この他にご質問がある場合は、コミュニティに質問、またはこちらのレポートをダウンロードしてください。「Alteryx Server:エンタープライズ向けのセルフサービスデータ分析のスケーリング(Scaling Self-Service Data Analytics for the Enterprise...」。

 

Josh Howard